Please use this identifier to cite or link to this item: https://hdl.handle.net/10923/1657
Full metadata record
DC FieldValueLanguage
dc.contributor.advisorOliveira, Joao Batista Souza deen_US
dc.contributor.authorPrimo, Tiago Thompsenen_US
dc.date.accessioned2013-08-07T18:43:27Z-
dc.date.available2013-08-07T18:43:27Z-
dc.date.issued2008pt_BR
dc.identifier.urihttp://hdl.handle.net/10923/1657-
dc.description.abstractNeste trabalho serão abordados estudos referentes à classificação de grande quantidade de documentos de conteúdo variável. Em tal processo quando um grande número de documentos é gerado, existe a necessidade de um usuário verificá-los um a um com a intenção de separá-los em bons (com pouco ou nenhum problema estrutural) ou ruins (que possuem problemas estruturais), processo este considerado lento e oneroso. Considerando este problema, neste trabalho foi desenvolvida uma ferramenta de classificação estética de documentos que visa reduzir esta intervenção humana. A ferramenta desenvolvida é baseada em métricas que avaliam o quanto um documento automaticamente gerado difere de seu template, criando para cada um destes documentos uma assinatura baseada nas técnicas de fingerprint, objetivando primeiramente distingui-los entre si para então utilizar técnicas de clusterização criando grupos de documentos com características semelhantes. O algoritmo K-Medóides é usado para fazer tal agrupamento, tal algoritmo funciona criando grupos de objetos considerando um destes como base para a criação de cada cluster. A idéia deste trabalho é reduzir a intervenção humana fazendo com que um usuário classifique em bom ou ruim apenas determinados documentos de cada grupo formado pelo algoritmo de clusterização. São também apresentados resultados de quatro experimentos realizados com esta ferramenta avaliando as contribuições para diminuir a intervenção humana no processo de classificação de documentos.pt_BR
dc.description.abstractThis work presents a study about classifying a large amount of variable data printing documents. At such process when a large number of documents is generated there is the need for a user to classify then one by one with the goal to separate then in good (those with none or few structural problem) or bad (those with several structural problems), a process that is considered very slow. Considering this problem, in this work we build a tool for aesthetical document classification, winch has the goal to reduce such human intervention. The developed tool is based on metrics that determines how different are the documents that was automatic generated to their respective template, creating for each one of those documents a signature based in the fingerprinting techniques. After that, clustering techniques are used to create groups which the documents that have similar characteristics. The K-Medoids algorithm is used to create those groups. Such algorithm works creating groups of objects considering one of then as a base for each created cluster. The main idea is to reduce the human intervention by asking for a user to classify in good or bad specific documents on each cluster. It is also presented the results of four experiments that was realized with this tool, evaluating the contributions to reduce the human intervention in the document classification process.en_US
dc.language.isoPortuguêspt_BR
dc.publisherPontifícia Universidade Católica do Rio Grande do Sulpt_BR
dc.subjectINFORMÁTICApt_BR
dc.subjectALGORITMOSpt_BR
dc.subjectAGRUPAMENTO DE INFORMAÇÕES (INFORMÁTICA)pt_BR
dc.subjectDOCUMENTAÇÃOpt_BR
dc.titleMétodos de clusterização para apoio à classificação estética de documentospt_BR
dc.typemasterThesispt_BR
dc.degree.grantorPontifícia Universidade Católica do Rio Grande do Sulpt_BR
dc.degree.departmentFaculdade de Informáticapt_BR
dc.degree.programPrograma de Pós-Graduação em Ciência da Computaçãopt_BR
dc.degree.levelMestradopt_BR
dc.degree.date2008pt_BR
dc.publisher.placePorto Alegrept_BR
Appears in Collections:Dissertação e Tese

Files in This Item:
File Description SizeFormat 
000406128-Texto+Completo-0.pdfTexto Completo15,68 MBAdobe PDFOpen
View


All Items in PUCRS Repository are protected by copyright, with all rights reserved, and are licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. Read more.