Please use this identifier to cite or link to this item: https://hdl.handle.net/10923/26251
Type: Article
Title: Comparação de modelos de machine learning para previsão de churn em uma empresa de mídia de Porto Alegre
Author(s): Souza, Filipe Carbonera de
Advisor: Souza, Alessandro Nunes de
Issue Date: 2023
Keywords: CANCELAMENTO
APRENDIZADO DE MÁQUINA
MÍDIA
ASSINATURA
CHURN
MACHINE LEARNING
MEDIA
SUBSCRIPTION
Abstract: Este artigo trata-se de um estudo de caso em que foram elaborados modelos de machine learning para previsão de churn de um produto digital de uma empresa de mídia de Porto Alegre. O objetivo deste artigo é identificar o melhor modelo de machine learning disponível na ferramenta utilizada pela empresa, o BigQuery, e quais dados tem maior relação direta com o cancelamento dos clientes. As métricas de precisão, recall, acurácia e matriz de confusão foram utilizadas para medir a performance dos modelos treinados e foi aplicado o método backward elimination no modelo de maior acurácia para compreender a relação das variáveis utilizadas para a acurácia do modelo. Os modelos apresentaram resultados semelhantes, com exceção da regressão logística, e as variáveis de maior relevância para os modelos foram acessos via newsletter, tempo de base, sistema operacional mais utilizado, produto assinado, plataforma e browser mais acessados.
This article is a case study where machine learning models were developed to predict the churn of a digital product from a media company in Porto Alegre. The purpose of this article is to identify the best machine learning model available in the tool BigQuery and which feature has the greatest direct relationship with customer churn. The metrics of precision, recall, accuracy and confusion matrix were used to measure the performance of the trained models and the backward elimination method was applied to the model with the highest accuracy to understand the relationship of the variables used for the accuracy of the model. The models had similar results with the exception of logistic regression and the variables with most relevance for the models were hits via newsletter, base time, most used operational system, subscribed product, most accessed platform and browser.
URI: https://hdl.handle.net/10923/26251
Appears in Collections:TCC Administração: Administração de Empresas

Files in This Item:
File Description SizeFormat 
2023_1_FILIPE_CARBONERA_DE_SOUZA_TCC.pdfTexto completo406,38 kBAdobe PDFOpen
View


All Items in PUCRS Repository are protected by copyright, with all rights reserved, and are licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. Read more.