Use este identificador para citar ou linkar para este item:
https://repositorio.ufpb.br/jspui/handle/123456789/32910
Tipo: | TCC |
Título: | Retenção de clientes e ciência de dados: uma análise de modelos de aprendizado de máquina na previsão de Churns em uma associação de investidores-anjos da cidade de São Paulo |
Autor(es): | Fernandes, Juan Almeida |
Primeiro Orientador: | Xavier, Gustavo Correia |
Resumo: | O presente estudo tem como objetivo analisar como diferentes modelos de Aprendizado de Máquina contribuem para melhorar a previsão do ato de cancelamento (churn) do cliente na Associação de Investidores-Anjos da Fundação Getúlio Vargas (GVAngels). Para tanto, foi adotada uma abordagem quantitativa para investigar o desempenho dos modelos de Aprendizado de Máquina na previsão de churns da organização, sendo que o estudo empírico partiu do framework CRISP-DM, com o intuito de orientar o desenvolvimento dos processos de Ciência de Dados e a criação de uma inteligência de dados capaz de prever cancelamentos e apoiar positivamente a tomada de decisões estratégicas acerca de churn na empresa. Conforme o framework CRISP-DM, o cientista de dados passou por todas as etapas de compreensão do negócio, entendimento e preparação dos dados, para então descrever e explicar como diferentes fatores e variáveis podem contribuir com o conjunto de informações a serem incluídos no modelo preditivo. Em seguida, ocorreu a realização da modelagem e avaliação e, por fim, a implantação na rotina organizacional. Dessa forma, seguindo os passos do framework, foi inicialmente construída uma estrutura de dados robusta que reúne todas as informações de membros ativos e inativos do grupo, contendo aproximadamente 600 registros únicos de pessoas e mais de 3.000 linhas referentes às atividades de engajamento, que hoje está sendo plenamente aplicada na Gestão de Dados e Relacionamento da empresa. Essa base serviu como escopo à geração dos modelos preditivos de Regressão Logística, LASSO, Random Forest e XGBoost, que, por sua vez, foram comparados estatisticamente quanto ao seu poder preditivo e, graças a uma diferença significativa, foi declarada a vitória da técnica de XGBoost em relação às outras, por apresentar as métricas de recall e F1-Score superiores às demais, sendo elas as principais medidas consideradas dentro do problema de churn. Portanto, os resultados da pesquisa contribuem para a prática empresarial, ao oferecer uma solução eficaz que venha a minimizar o impacto dos churns na Associação de Investidores-Anjo da FGV, bem como à área acadêmica, uma vez que demonstram a aplicabilidade das técnicas de Data Science em um contexto real e complexo, explorando a eficiência desses modelos no small data, caso tipicamente encontrado em organizações semelhantes à associação em estudo. |
Abstract: | No abstract |
Palavras-chave: | Churn Ciência de Dados CRISP-DM Machine Learning XGBoost |
CNPq: | CNPQ::CIENCIAS SOCIAIS APLICADAS::ADMINISTRACAO |
Idioma: | por |
País: | Brasil |
Editor: | Universidade Federal da Paraíba |
Sigla da Instituição: | UFPB |
Departamento: | Administração |
Tipo de Acesso: | Acesso aberto |
URI: | https://repositorio.ufpb.br/jspui/handle/123456789/32910 |
Data do documento: | 31-Out-2024 |
Aparece nas coleções: | TCC - Administração - CCHSA |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Juan Almeida Fernandes.pdf | 1,27 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.