Utilize este identificador para citar ou criar um atalho para este documento:
https://hdl.handle.net/10923/7741
Tipo: | masterThesis |
Título: | Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia |
Autor(es): | Weber, Cristofer |
Orientador: | Vieira, Renata |
Editora: | Pontifícia Universidade Católica do Rio Grande do Sul |
Programa: | Programa de Pós-Graduação em Ciência da Computação |
Data de Publicação: | 2015 |
Palavras-chave: | INFORMÁTICA PROCESSAMENTO DA LINGUAGEM NATURAL LINGUÍSTICA COMPUTACIONAL |
Resumo: | Algumas tarefas de processamento de linguagem natural podem ser aprendidas por algoritmos a partir de corpus de exemplo, mas a obtenção destes exemplos pode ser um gargalo. Neste trabalho nós investigamos como a Wikipedia e a DBpedia, dois recursos de linguagem disponíveis de forma gratuita, podem ser utilizados como corpus para a classificação de entidades nomeadas, uma tarefa fundamental de extração de informações e um passo necessário para outras tarefas como extração de relações e resolução de co-referências. Some natural language processing tasks can be learned from example corpora, but having enough examples for the task at hands can be a bottleneck. In this work we address how Wikipedia and DBpedia, two freely available language resources, can be used to support Named Entity Recognition, a fundamental task in Information Extraction and a necessary step of other tasks such as Co-reference Resolution and Relation Extraction. |
URI: | http://hdl.handle.net/10923/7741 |
Aparece nas Coleções: | Dissertação e Tese
|
Todos os itens no Repositório da PUCRS estão protegidos por copyright, com todos os direitos reservados, e estão licenciados com uma Licença Creative Commons - Atribuição-NãoComercial 4.0 Internacional. Saiba mais.