Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia

Please use this identifier to cite or link to this item: https://hdl.handle.net/10923/7741

Type:	masterThesis
Title:	Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia
Author(s):	Weber, Cristofer
Advisor:	Vieira, Renata
Publisher:	Pontifícia Universidade Católica do Rio Grande do Sul
Graduate Program:	Programa de Pós-Graduação em Ciência da Computação
Issue Date:	2015
Keywords:	INFORMÁTICA PROCESSAMENTO DA LINGUAGEM NATURAL LINGUÍSTICA COMPUTACIONAL
Abstract:	Algumas tarefas de processamento de linguagem natural podem ser aprendidas por algoritmos a partir de corpus de exemplo, mas a obtenção destes exemplos pode ser um gargalo. Neste trabalho nós investigamos como a Wikipedia e a DBpedia, dois recursos de linguagem disponíveis de forma gratuita, podem ser utilizados como corpus para a classificação de entidades nomeadas, uma tarefa fundamental de extração de informações e um passo necessário para outras tarefas como extração de relações e resolução de co-referências. Some natural language processing tasks can be learned from example corpora, but having enough examples for the task at hands can be a bottleneck. In this work we address how Wikipedia and DBpedia, two freely available language resources, can be used to support Named Entity Recognition, a fundamental task in Information Extraction and a necessary step of other tasks such as Co-reference Resolution and Relation Extraction.
URI:	http://hdl.handle.net/10923/7741
Appears in Collections:	Dissertação e Tese

Files in This Item:

File	Description	Size	Format
000476712-Texto+Completo-0.pdf	Texto Completo	1,38 MB	Adobe PDF	Open View