Skip navigation

Use este identificador para citar ou linkar para este item: https://repositorio.ufpb.br/jspui/handle/123456789/32390
Tipo: Dissertação
Título: Previsão de demanda de cosméticos no varejo utilizando aprendizagem de máquina
Autor(es): Sousa, Ana Clara Chaves
Primeiro Orientador: Rêgo, Thaís Gaudencio do
Primeiro Coorientador: Barbosa, Yuri de Almeida Malheiros
Resumo: A tomada de decisão baseada em dados foi facilitada devido à alta disponibilidade de dados e à maior capacidade de processamento dos computadores. Para auxiliar na tomada de decisão, é possível extrair informações dos dados através da Ciência de Dados. Um exemplo em que há grande aplicabilidade dessa ciência nas empresas é a previsão de demanda dentro da área de Gestão da Cadeia de Abastecimento. Fazer a previsão do volume de vendas não é uma tarefa trivial e, além disso, imprecisões nessa previsão podem causar ruptura de estoque ou afetar sua gestão. Neste estudo, será feita a previsão de vendas de dois canais de venda diferentes utilizando algoritmos de Aprendizado de Máquina para uma marca de uma grande empresa. Essa empresa está alocada no mercado de Higiene Pessoal, Perfumaria e Cosméticos, em que o Brasil é o quarto maior mercado consumidor do mundo. Foram utilizados dados dos anos de 2018 a 2023 de vendas que ocorreram em todos os estados brasileiros. As previsões foram feitas em três diferentes horizontes de tempo, sendo eles: curto prazo (próximo período), médio prazo (aproximadamente 3 meses à frente) e longo prazo (cerca de 7 meses à frente). O curto prazo é referente ao próximo ciclo para os métodos de regressão e próxima semana para o método de série temporal, o médio prazo é referente aos 5 ciclos à frente para os métodos de regressão e 15 semanas à frente para o método de série temporal e o longo prazo é referente à previsão de 10 ciclos à frente para os métodos de regressão e 30 semanas à frente para o método de série temporal. Sendo assim, a consistência dos modelos de Aprendizado de Máquina também foi avaliada. Os algoritmos analisados neste estudo foram: CatBoost, LightGBM, XGBoost e Prophet. Primeiramente, os métodos de Gradient Boosting mencionados foram comparados a fim de identificar qual dos três métodos indicou maior estabilidade ao prever múltiplos horizontes. O XGBoost apresentou os menores erros para o canal Loja na previsão em todos os três horizontes (10% para o curto prazo, 2,12% para o médio prazo e 6,4% para o longo prazo). Para o canal Venda Direta, o XGBoost não apresentou o menor WAPE em todos os horizontes, mas teve mais estabilidade em comparação ao CatBoost e ao LightGBM. Em sequência, o XGBoost foi comparado com um método de séries temporais, o Prophet. Comparando os dois modelos em cenários distintos, concluiu-se que o Prophet apresentou resultados mais satisfatórios e maior estabilidade na previsão de múltiplos horizontes temporais.
Abstract: Data-driven decision making was facilitated due to the high availability of data and the greater processing power of computers. To assist in decision making, it is possible to extract information from data through Data Science. An example in which there is great applicability of this science in companies is demand forecasting within the Supply Chain Management area. Forecasting sales volume is not a trivial task and inaccuracies in this forecast can cause stock-outs or affect its management. In this study, sales forecasts will be made for two different sales channels using Machine Learning algorithms for a brand owned by a large company. This company is in the Cosmetics, Fragrances and Toiletries market, where Brazil is the fourth largest consumer market in the world. Data was used from the years 2018 to 2023 on sales in all Brazilian states. Forecasts were made for three different time horizons: short term (next period), medium term (approximately 3 months ahead) and long term (approximately 7 months ahead). The short term refers to the next cycle for the regression methods and the next week for the time series method, the medium term refers to 5 cycles ahead for the regression methods and 15 weeks ahead for the time series method and the long term refers to the forecast of 10 cycles ahead for the regression methods and 30 weeks ahead for the time series method. Therefore, the consistency of the Machine Learning models was also evaluated. The algorithms analyzed in this study were CatBoost, LightGBM, XGBoost and Prophet. Firstly, the aforementioned Gradient Boosting methods were compared in order to identify which of the three methods showed the greatest stability when predicting multiple horizons. XGBoost had the lowest forecast errors for the Store channel in all three horizons (10% for the short term, 2.12% for the medium term and 6.4% for the long term). For the Direct Sales channel, XGBoost didn’t have the lowest WAPE in all horizons, but it was more stable compared to CatBoost and LightGBM. Next, XGBoost was compared with a time series method, Prophet. Comparing the two models in different scenarios, it was concluded that Prophet showed more satisfactory results and more stability in forecasting multiple time horizons.
Palavras-chave: Aprendizado de máquina
Previsão de séries temporais
Gradient boosting
Prophet - Método
Cosméticos no varejo
Time Series Forecasting
Machine Learning
Gradient Boosting
Prophet
Retail
CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Idioma: por
País: Brasil
Editor: Universidade Federal da Paraíba
Sigla da Instituição: UFPB
Departamento: Informática
Programa: Programa de Pós-Graduação em Informática
Tipo de Acesso: Acesso aberto
Attribution-NoDerivs 3.0 Brazil
URI: http://creativecommons.org/licenses/by-nd/3.0/br/
URI: https://repositorio.ufpb.br/jspui/handle/123456789/32390
Data do documento: 28-Fev-2024
Aparece nas coleções:Centro de Informática (CI) - Programa de Pós-Graduação em Informática

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
AnaClaraChavesSousa_Dissert.pdf2,01 MBAdobe PDFVisualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons