Um algoritmo evolutivo para indução de árvores de regressão robusto a valores ausentes

Blomberg, Luciano Costa

Please use this identifier to cite or link to this item: https://hdl.handle.net/10923/6829

Full metadata record

DC Field	Value	Language
dc.contributor.advisor	Ruiz, Duncan Dubugras Alcoba	pt_BR
dc.contributor.author	Blomberg, Luciano Costa	pt_BR
dc.date.accessioned	2014-09-23T02:01:03Z	-
dc.date.available	2014-09-23T02:01:03Z	-
dc.date.issued	2014	pt_BR
dc.identifier.uri	http://hdl.handle.net/10923/6829	-
dc.description.abstract	Uma preocupação comum em muitas áreas do conhecimento envolve problemas de baixa qualidade de dados, tais como ruídos e dados ausentes. Na área de aprendizado de máquina, por exemplo, dados ausentes têm gerado sérios problemas no processo de extração de conhecimento, ocultando importantes informações sobre o dataset, enviesando resultados e afetando o desempenho preditivo dos modelos induzidos. Para lidar com esse problema, muito tem se discutido na literatura sobre estratégias de tratamento, seja por préprocessamento ou por meio do desenvolvimento de algoritmos robustos a dados ausentes. Neste trabalho, propõe-se um novo algoritmo evolutivo para indução de árvores de regressão, agregando em seu ciclo evolutivo múltiplas estratégias para lidar com dados ausentes. Com o objetivo de fazer uma análise comparativa, foram avaliados 6 tradicionais algoritmos de regressão, considerando para tanto, 10 datasets artificialmente modificados para manterem diferentes níveis de dados ausentes. Resultados da análise experimental mostram que a solução proposta apresenta uma boa relação custo-benefício entre compreensibilidade dos modelos e desempenho preditivo, especialmente para as bases de dados com mais de 40% de dados ausentes.	pt_BR
dc.description.abstract	A common concern in many fields of knowledge involves problems of low quality data, such as noise and missing data. In the machine learning area, for example, missing data has generated serious problems in the knowledge extraction process, hiding important information about the dataset, skewing results and affecting the accuracy of the induced models. In order to deal with these problems, much has been discussed in the literature about missing values treatment strategies, either by preprocessing tasks or by the implementation of robust algorithms to missing data. In this thesis, we introduce a new evolutionary algorithm for induction of regression trees, including multiple strategies in its evolutionary cycle for dealing with missing data. Aiming to make a comparative analysis, we evaluated six traditional regression algorithms over 10 public datasets artificially modified to present different levels of missing data. Results from the experimental analysis show that the proposed solution presents a good trade-off between model interpretability and predictive performance, especially for datasets with more than 40% of missing data.	en_US
dc.language.iso	Português	pt_BR
dc.publisher	Pontifícia Universidade Católica do Rio Grande do Sul	pt_BR
dc.rights	openAccess	en_US
dc.subject	INFORMÁTICA	pt_BR
dc.subject	APRENDIZAGEM DE MÁQUINA	pt_BR
dc.subject	ALGORITMOS (PROGRAMAÇÃO)	pt_BR
dc.title	Um algoritmo evolutivo para indução de árvores de regressão robusto a valores ausentes	pt_BR
dc.type	doctoralThesis	pt_BR
dc.degree.grantor	Pontifícia Universidade Católica do Rio Grande do Sul	pt_BR
dc.degree.department	Faculdade de Informática	pt_BR
dc.degree.program	Programa de Pós-Graduação em Ciência da Computação	pt_BR
dc.degree.level	Doutorado	pt_BR
dc.degree.date	2014	pt_BR
dc.publisher.place	Porto Alegre	pt_BR
Appears in Collections:	Dissertação e Tese

Files in This Item:

File	Description	Size	Format
000461465-Texto+Completo-0.pdf	Texto Completo	5,3 MB	Adobe PDF	Open View

Show simple item record See statistics Search for other versions of fulltext via SFX