Please use this identifier to cite or link to this item: https://hdl.handle.net/10923/1539
Type: masterThesis
Title: Uso de relações semântico-estruturais no aprimoramento do cálculo da similaridade semântica: um estudo voltado a estruturas ontológicas em língua portuguesa
Author(s): Brandolt, Josiane Fontoura dos Anjos
Advisor: Lima, Vera Lúcia Strube de
Publisher: Pontifícia Universidade Católica do Rio Grande do Sul
Graduate Program: Programa de Pós-Graduação em Ciência da Computação
Issue Date: 2009
Keywords: INFORMÁTICA
ONTOLOGIA
TAXIONOMIA
SEMÂNTICA
Abstract: O presente trabalho tem como objetivo estudar alternativas para aprimorar a medida SiSe (Similaridade Semântica), que foi proposta por Freitas [FRE07]. Esta medida visa o mapeamento de termos entre estruturas ontológicas distintas, utilizando uma adaptação do Modelo Taxonômico de Maedche e Staab [MAE02b] para o cálculo da similaridade semântica que faz uma comparação da similaridade entre termos de estruturas ontológicas distintas através da análise da hierarquia em que os mesmos se inserem, seus superconceitos e subconceitos. Desta forma, o coeficiente resultante é a similaridade semântico-estrutural entre os termos das estruturas ontológicas. A medida SiSe levou a coeficientes de similaridade considerados relativamente satisfatórios para o mapeamento semântico-estrutural, porém não atingiu seus objetivos em alguns casos para os quais foi testada. Incluem-se aqui os resultados considerados como falsos positivos e os casos de similaridade que a medida não detectou (falsos negativos). Partindo desses problemas, estratégias de similaridade estrutural são propostas para aprimorar, assim, a medida SiSe. As estratégias são baseadas, em sua maioria, em trabalhos da literatura que abordam a similaridade estrutural através de: i) atribuições de fatores de adequação fundamentados na posição dos termos na hierarquia da estrutura ontológica; ii) atribuições de conjuntos formados pelos superconceitos dos termos analisados; iii) atribuições de conjuntos formados pelos subconceitos destes termos e; iv) o uso da medida de Jaccard corrigida. As estratégias são descritas e avaliadas de acordo com um recurso denominado Golden Mapping e métricas mais comumente utilizadas na literatura: precisão, abrangência e medida-F. Os resultados obtidos chegaram a 100% de acurácia no que se refere aos falsos positivos da SiSe.
This work presents a study on alternative techniques to improve SiSe measure (Semantic Similarity), which was proposed by Freitas [FRE07]. This measure refers to the mapping of terms between different ontological structures, using an adaptation of the Taxonomic Model of Maedche and Staab (2002) for the semantic similarity calculus. SiSe makes a similarity comparison between terms of different ontological structures through term hierarchy analysis, their superconcepts and subconcepts. In this context, the resulting coefficient is the semantic-structural similarity between terms from ontological structures. The original SiSe measure showed relatively satisfactory coefficients for the semantic-structural mapping. However, it did not achieve its goals in some testing cases. Some examples are the results considered as false positives and the similarity cases that were not detected by the measure (false negatives). Based on these problems, new structural similarity strategies are proposed to improve the SiSe measure. These strategies are mostly based on related works which deal with structural similarity through: i) the attribution of adequacy factors based in the term position in the ontological structural hierarchy; ii) the arrangement of sets formed by their super-concepts; iii) the arrangement of sets formed by their sub-concepts; and iv) the usage of the corrected Jaccard measure. These strategies are explained and evaluated according to Golden Mapping and state of the art metrics: precision, recall and F-measure. The obtained results reached 100% of accuracy in SiSe false positive cases.
URI: http://hdl.handle.net/10923/1539
Appears in Collections:Dissertação e Tese

Files in This Item:
File Description SizeFormat 
000416526-Texto+Completo-0.pdfTexto Completo2,16 MBAdobe PDFOpen
View


All Items in PUCRS Repository are protected by copyright, with all rights reserved, and are licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. Read more.