Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10923/1539
Tipo: masterThesis
Título: Uso de relações semântico-estruturais no aprimoramento do cálculo da similaridade semântica: um estudo voltado a estruturas ontológicas em língua portuguesa
Autor(es): Brandolt, Josiane Fontoura dos Anjos
Orientador: Lima, Vera Lúcia Strube de
Editor: Pontifícia Universidade Católica do Rio Grande do Sul
Programa: Programa de Pós-Graduação em Ciência da Computação
Fecha de Publicación: 2009
Palabras clave: INFORMÁTICA
ONTOLOGIA
TAXIONOMIA
SEMÂNTICA
Resumen: O presente trabalho tem como objetivo estudar alternativas para aprimorar a medida SiSe (Similaridade Semântica), que foi proposta por Freitas [FRE07]. Esta medida visa o mapeamento de termos entre estruturas ontológicas distintas, utilizando uma adaptação do Modelo Taxonômico de Maedche e Staab [MAE02b] para o cálculo da similaridade semântica que faz uma comparação da similaridade entre termos de estruturas ontológicas distintas através da análise da hierarquia em que os mesmos se inserem, seus superconceitos e subconceitos. Desta forma, o coeficiente resultante é a similaridade semântico-estrutural entre os termos das estruturas ontológicas. A medida SiSe levou a coeficientes de similaridade considerados relativamente satisfatórios para o mapeamento semântico-estrutural, porém não atingiu seus objetivos em alguns casos para os quais foi testada. Incluem-se aqui os resultados considerados como falsos positivos e os casos de similaridade que a medida não detectou (falsos negativos). Partindo desses problemas, estratégias de similaridade estrutural são propostas para aprimorar, assim, a medida SiSe. As estratégias são baseadas, em sua maioria, em trabalhos da literatura que abordam a similaridade estrutural através de: i) atribuições de fatores de adequação fundamentados na posição dos termos na hierarquia da estrutura ontológica; ii) atribuições de conjuntos formados pelos superconceitos dos termos analisados; iii) atribuições de conjuntos formados pelos subconceitos destes termos e; iv) o uso da medida de Jaccard corrigida. As estratégias são descritas e avaliadas de acordo com um recurso denominado Golden Mapping e métricas mais comumente utilizadas na literatura: precisão, abrangência e medida-F. Os resultados obtidos chegaram a 100% de acurácia no que se refere aos falsos positivos da SiSe.
This work presents a study on alternative techniques to improve SiSe measure (Semantic Similarity), which was proposed by Freitas [FRE07]. This measure refers to the mapping of terms between different ontological structures, using an adaptation of the Taxonomic Model of Maedche and Staab (2002) for the semantic similarity calculus. SiSe makes a similarity comparison between terms of different ontological structures through term hierarchy analysis, their superconcepts and subconcepts. In this context, the resulting coefficient is the semantic-structural similarity between terms from ontological structures. The original SiSe measure showed relatively satisfactory coefficients for the semantic-structural mapping. However, it did not achieve its goals in some testing cases. Some examples are the results considered as false positives and the similarity cases that were not detected by the measure (false negatives). Based on these problems, new structural similarity strategies are proposed to improve the SiSe measure. These strategies are mostly based on related works which deal with structural similarity through: i) the attribution of adequacy factors based in the term position in the ontological structural hierarchy; ii) the arrangement of sets formed by their super-concepts; iii) the arrangement of sets formed by their sub-concepts; and iv) the usage of the corrected Jaccard measure. These strategies are explained and evaluated according to Golden Mapping and state of the art metrics: precision, recall and F-measure. The obtained results reached 100% of accuracy in SiSe false positive cases.
URI: http://hdl.handle.net/10923/1539
Aparece en las colecciones:Dissertação e Tese

Ficheros en este ítem:
Fichero Descripción TamañoFormato 
000416526-Texto+Completo-0.pdfTexto Completo2,16 MBAdobe PDFAbrir
Ver


Todos los ítems en el Repositorio de la PUCRS están protegidos por derechos de autor, con todos los derechos reservados, y están bajo una licencia de Creative Commons Reconocimiento-NoComercial 4.0 Internacional. Sepa más.