Please use this identifier to cite or link to this item: https://hdl.handle.net/10923/15656
Type: masterThesis
Title: Understanding contracts in natural language
Author(s): Pinheiro, Daniele Antunes
Advisor: Meneguzzi, Felipe Rech
Publisher: Pontifícia Universidade Católica do Rio Grande do Sul
Graduate Program: Programa de Pós-Graduação em Ciência da Computação
Issue Date: 2019
Keywords: MINERAÇÃO DE DADOS (INFORMÁTICA)
INFORMÁTICA
CONTRATOS (DIREITO COMERCIAL)
Abstract: Contratos são acordos entre pessoas ou organizações, chamados de partes. Geralmente são escritos em linguagem formal e são compostos por um conjuntos de regras que devem ser seguidas pelas partes envolvidas nele. No processamento de contratos, é comum assumir uma etapa manual para extrair os componentes do contrato, o que é uma tarefa que exige tempo e geralmente é baseada em domínio específico. Considerando um cenário onde todos os dias há mais pessoas interessadas em processar o trabalho legal, uma ferramenta automatizada para extrair componentes contratuais é extremamente útil. Esta pesquisa definiu um método para extrair e formalizar automaticamente esses componentes, resultando em uma estrutura semântica útil para outros projetos. Para avaliar nosso trabalho, nós criamos um dataset com 15 contratos anotados e medimos a nossa acurácia em diferentes tipos de extração. Nossa abordagem foi utilizada em dois tipos de processamento de contratos: uma nova avaliação de equanimidade e na identificação de conflitos, com resultados competitivos em relação ao estado da arte.
Contracts are agreements between people or organization, called parties. They are usually written in formal language and are composed of a set of rules to be followed by the parties involved in it. In the processing of contracts, it is common to assume a manual step to extract the contract components to work with, which is a task that demands time and usually is domain based. Considering a scenario where every day there are more people interested in processing legal work, an automated tool to extract contractual components is extremely useful. This research defines an approach to automatically extract and formalize these components resulting in a semantic structure useful for other projects. To evaluate our work, we created a dataset containing 15 annotated contracts and measure our accuracy over different types of extractions. Our approach was used in two contract processing tasks: a new evaluation of fairness and conflict identification, with competitive results with the state of the art.
URI: http://hdl.handle.net/10923/15656
Appears in Collections:Dissertação e Tese

Files in This Item:
File Description SizeFormat 
000495952-Texto+Completo-0.pdfTexto Completo790,06 kBAdobe PDFOpen
View


All Items in PUCRS Repository are protected by copyright, with all rights reserved, and are licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. Read more.