Skip navigation

Use este identificador para citar ou linkar para este item: https://repositorio.ufpb.br/jspui/handle/123456789/32910
Tipo: TCC
Título: Retenção de clientes e ciência de dados: uma análise de modelos de aprendizado de máquina na previsão de Churns em uma associação de investidores-anjos da cidade de São Paulo
Autor(es): Fernandes, Juan Almeida
Primeiro Orientador: Xavier, Gustavo Correia
Resumo: O presente estudo tem como objetivo analisar como diferentes modelos de Aprendizado de Máquina contribuem para melhorar a previsão do ato de cancelamento (churn) do cliente na Associação de Investidores-Anjos da Fundação Getúlio Vargas (GVAngels). Para tanto, foi adotada uma abordagem quantitativa para investigar o desempenho dos modelos de Aprendizado de Máquina na previsão de churns da organização, sendo que o estudo empírico partiu do framework CRISP-DM, com o intuito de orientar o desenvolvimento dos processos de Ciência de Dados e a criação de uma inteligência de dados capaz de prever cancelamentos e apoiar positivamente a tomada de decisões estratégicas acerca de churn na empresa. Conforme o framework CRISP-DM, o cientista de dados passou por todas as etapas de compreensão do negócio, entendimento e preparação dos dados, para então descrever e explicar como diferentes fatores e variáveis podem contribuir com o conjunto de informações a serem incluídos no modelo preditivo. Em seguida, ocorreu a realização da modelagem e avaliação e, por fim, a implantação na rotina organizacional. Dessa forma, seguindo os passos do framework, foi inicialmente construída uma estrutura de dados robusta que reúne todas as informações de membros ativos e inativos do grupo, contendo aproximadamente 600 registros únicos de pessoas e mais de 3.000 linhas referentes às atividades de engajamento, que hoje está sendo plenamente aplicada na Gestão de Dados e Relacionamento da empresa. Essa base serviu como escopo à geração dos modelos preditivos de Regressão Logística, LASSO, Random Forest e XGBoost, que, por sua vez, foram comparados estatisticamente quanto ao seu poder preditivo e, graças a uma diferença significativa, foi declarada a vitória da técnica de XGBoost em relação às outras, por apresentar as métricas de recall e F1-Score superiores às demais, sendo elas as principais medidas consideradas dentro do problema de churn. Portanto, os resultados da pesquisa contribuem para a prática empresarial, ao oferecer uma solução eficaz que venha a minimizar o impacto dos churns na Associação de Investidores-Anjo da FGV, bem como à área acadêmica, uma vez que demonstram a aplicabilidade das técnicas de Data Science em um contexto real e complexo, explorando a eficiência desses modelos no small data, caso tipicamente encontrado em organizações semelhantes à associação em estudo.
Abstract: No abstract
Palavras-chave: Churn
Ciência de Dados
CRISP-DM
Machine Learning
XGBoost
CNPq: CNPQ::CIENCIAS SOCIAIS APLICADAS::ADMINISTRACAO
Idioma: por
País: Brasil
Editor: Universidade Federal da Paraíba
Sigla da Instituição: UFPB
Departamento: Administração
Tipo de Acesso: Acesso aberto
URI: https://repositorio.ufpb.br/jspui/handle/123456789/32910
Data do documento: 31-Out-2024
Aparece nas coleções:TCC - Administração - CCHSA

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Juan Almeida Fernandes.pdf1,27 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.