Enriching portuguese word embeddings with visual information

Consoli, Bernardo Scapini

Utilize este identificador para citar ou criar um atalho para este documento: https://hdl.handle.net/10923/17400

Tipo:	masterThesis
Título:	Enriching portuguese word embeddings with visual information
Autor(es):	Consoli, Bernardo Scapini
Orientador:	Vieira, Renata
Editora:	Pontifícia Universidade Católica do Rio Grande do Sul
Programa:	Programa de Pós-Graduação em Ciência da Computação
Data de Publicação:	2021
Palavras-chave:	PROCESSAMENTO DA LINGUAGEM NATURAL LINGUÍSTICA COMPUTACIONAL INFORMÁTICA
Resumo:	Essa dissertação foca no enriquecimento de word embeddings pré-treinados na língua Portuguesa com o uso de informações visuais. Essas informações foram extraídas de imagens retratando certos termos do vocabulário e embeddings visuais "imaginadas" para termos sem dados de imagem. Essas embeddings enriquecidas foram testadas contra seus modelos textuais originais em tarefas comuns de PLN, sendo elas: relação entre palavras, predição de analogias, reconhecimento de entidades nomeadas e similaridade de sentenças. Essas tarefas foram utilizadas para descobrir se o enriquecimento tem impacto sobre a performance dos embeddings nas tarefas em questão. Os resultados demonstram um aumento de desempenho para algumas tarefas, o que indica que o enriquecimento com dados visuais é útil para tarefas de PLN baseadas em word embeddings. This dissertation focuses on the enrichment of existing Portuguese word embeddings with visual information in the form of visual embeddings. This information was extracted from images portraying given vocabulary terms and imagined visual embeddings learned for terms with not image data. These enriched embeddings were tested against their text-only counterparts in common NLP tasks, namely: word relatedness, analogy prediction, named entity recognition, and sentence similarity. These tasks were used to ascertain whether the enrichment has an impact on the embedding’s performance the above mentioned tasks. The results show an increase in performance for several tasks, which indicates that visual information fusion for word embeddings can be useful for word embedding based NLP tasks.
URI:	https://hdl.handle.net/10923/17400
Aparece nas Coleções:	Dissertação e Tese

Arquivos neste item:

Arquivo	Descrição	Tamanho	Formato
000500008-Texto+completo-0.pdf	Texto completo	870,16 kB	Adobe PDF	Abrir Exibir

Ver em formato completo Ver estatísticas Busque outras versões desse texto via SFX

Todos os itens no Repositório da PUCRS estão protegidos por copyright, com todos os direitos reservados, e estão licenciados com uma Licença Creative Commons - Atribuição-NãoComercial 4.0 Internacional. Saiba mais.