Firma, zajmująca się sprzedażą detaliczną, postanowiła zbadać przyszły popyt na swoje produkty. Celem projektu było przewidzenie sumarycznego popytu na wszystkie produkty firmy w ciągu następnych 12 miesięcy. Dane użyte w analizie pochodziły z lat 2012-2017 i były to dane tabelaryczne dotyczące sprzedaży.
Przewidywanie w analizie szeregów czasowych odnosi się do prognozowania przyszłych wartości na podstawie wcześniejszych danych. W kontekście biznesowym jest to kluczowe dla planowania, zarządzania zapasami, budżetowania i wielu innych działań. Istnieją różne sposoby przewidywania w szeregach czasowych, a dwa najbardziej popularne to "one step ahead" oraz "multistep" lub "multioutput".
Jak sama nazwa wskazuje, przewiduje on tylko jedną następną wartość w szeregu czasowym. Z punktu widzenia biznesu jest to jak patrzenie w najbliższą przyszłość, np. prognozowanie sprzedaży na następny dzień. Zaletą tego podejścia jest to, że jest stosunkowo dokładne, ponieważ opiera się na najnowszych dostępnych danych. Jednak jego główną wadą jest to, że nie dostarcza długoterminowej perspektywy.
To podejście próbuje przewidzieć wiele przyszłych wartości na raz, np. prognozowanie sprzedaży na następne 12 miesięcy. Z biznesowego punktu widzenia daje to firmie długoterminową perspektywę i pozwala na lepsze planowanie. Jednak im dalej próbujemy spojrzeć w przyszłość, tym trudniej jest dokładnie przewidzieć wyniki. Dlatego prognozy wielokrokowe mają tendencję do gromadzenia większych błędów w miarę przedłużania okresu prognozy.
Podsumowując, wybór między jednym a wieloma krokami przewidywania zależy od konkretnych potrzeb biznesowych. Krótkoterminowe prognozy "one step ahead" są bardziej precyzyjne, ale nie oferują długoterminowej perspektywy. Prognozy wielokrokowe dają lepszy ogląd przyszłości, ale mogą być mniej dokładne w dłuższym okresie.
W trakcie realizacji korzystaliśmy z różnych modeli prognozowania, takich jak ARIMA, SARIMA, LinearRegression oraz RandomForestRegressor. Proces przygotowywania danych dla modeli LinearRegression oraz RandomForestRegressor okazał się wyjątkowo wymagający. Dane musiały zostać poddane szeregowi transformacji, aby były odpowiednio przygotowane do treningu i testowania. W ramach eksperymentów przetestowano modele z różnymi transformacjami, takimi jak transformacje logarytmiczne oraz różnicowanie.
Dekompozycja szeregu czasowego pozwala na podzielenie obserwowanych danych na trzy składniki: trend, sezonowość i resztę.
Jak czytać wyniki?
RMSE - im mnie tym lepiej
z transformacją logarytmiczną
- RMSE dla prognozy multi-step-ahead: 159425.5175
- RMSE dla prognozy one-step-ahead: 173034.6273
bez transformacji logarytmicznej
- RMSE dla prognozy multi-step-ahead: 171244.9721
- RMSE dla prognozy one-step-ahead: 167211.9424
Z przeprowadzonych analiz wynika, że najskuteczniejszym modelem okazał się SARIMA. Dzięki dokładnym prognozom, firma jest teraz w stanie lepiej planować swoją produkcję, zarządzać zapasami i skupiać się na strategiach marketingowych, które zwiększą popyt w okresach przewidywanego niższego obrotu. Ponadto, lepsze przewidywania sprzedaży mogą prowadzić do optymalizacji kosztów i zwiększenia rentowności. Właściwe prognozowanie to nie tylko kwestia liczbowych osiągnięć, ale przede wszystkim korzyść strategiczna, która pozwala firmie być krok przed konkurencją i odpowiednio reagować na zmieniające się warunki rynkowe.
Skontaktuj się i zacznij podejmować skuteczniejsze decyzje na podstawie analizy danych