Please use this identifier to cite or link to this item: https://hdl.handle.net/10923/10368
Type: masterThesis
Title: Um modelo de workflow científico para o refinamento da estrutura 3D aproximada de proteínas
Author(s): Soletti, Leonardo Veronese
Advisor: Souza, Osmar Norberto de
Publisher: Pontifícia Universidade Católica do Rio Grande do Sul
Graduate Program: Programa de Pós-Graduação em Ciência da Computação
Issue Date: 2015
Keywords: WORKFLOW
BIOLOGIA COMPUTACIONAL
INFORMÁTICA
Abstract: Com o advento da era pós-genômica surge, como consequência, uma explosão de informações onde inúmeras descobertas geram grande quantidade de dados biológicos. Mesmo com o avanço da tecnologia nas técnicas de predição de estruturas de proteínas, não é possível ainda se encontrar uma ferramenta capaz de predizer com precisão exata a estrutura 3D de proteínas. Em decorrência disso, surgem novos desafios para entender e organizar esses recursos nas pesquisas, o compartilhamento e reuso de experimentos bem-sucedidos, assim como prover interoperabilidade entre dados e ferramentas de diferentes locais e utilizados por usuários com perfis distintos. As atividades de estudos do fluxo destes dados, inicialmente, baseiam-se em scripts que auxiliam na entrada, processamento e resultado final da análise, normalmente executados por linha de comando, o que obriga seus usuários a terem domínio de algoritmos e lógica de programação. Tais scripts apresentam problemas em interferir, coletar e armazenar dados ao longo de sua execução, e podem ser muito complexos, ocasionando a dificuldades de implementação, manutenção e reuso. Outro problema é quando um conjunto de tarefas a serem realizadas através de scripts, podem ter o risco de faltar algum passo no processo ou não ser executado na ordem certa, obtendo-se com isso resultados não satisfatórios. Torna-se necessário técnicas e ferramentas que facilitem esse processo, de maneira organizada como uma sequência de etapas caracterizados por um fluxo de execução, automatizando-se assim este processo. Neste contexto, buscou-se desenvolver um modelo de workflow científico utilizando-se ferramentas de bioinformática e de conhecimentos da biologia para automatizar o processo de refinamento de proteínas, do polipeptídio predito pelo método CReF.Os scripts do processo de refinamento foram automatizados, com isso foi possível aumentar a quantidade de experimentos, mantendo um critério de qualidade aceitável. Para o resultado final do processo, desenvolveu-se uma interface web que facilita a visualização dos resultados de uma forma organizada.
As a consequence of the post-genomic era an explosion of information and numerous discoveries made available large amounts of biological data. Even with the technology enhancements regarding protein structure prediction techniques, it is still not possible to find a tool to predict with precision the exact the three-dimensional structure of a given protein. This brings new challenges, starting from how to understand and organize these resources until sharing and reuse of successful experiments, as well as how to provide interoperability between data from different sources, without mentioning the diversity between tools and different user profiles. This kind of data flow is regularly addressed as command line scripts which require users to have programming skills. Such scripts have problems interfering, collecting and storing data while executing. Furthermore, these scripts and can be very complex leading to difficulties of implementation, maintenance and reuse. Another problem that arises when a set of tasks are proposed to be conducted through scripts is the possibility of missing any step in the process or running at incorrect order, leading to inconsistent results. It becomes necessary techniques and tools to ease this process in an organized way as a sequence of steps characterized by a workflow, thus automating this process. In this context, we sought to develop a scientific workflow model using bioinformatics tools and biology expertise to automate the process of protein refinement of polypeptides predicted by CReF method once the refinement process scripts were automated, it was possible to increase the amount of experiments while maintaining an acceptable quality criteria. Finally, was developed a web interface that facilitates the visualization of the results in an organized way.
URI: http://hdl.handle.net/10923/10368
Appears in Collections:Dissertação e Tese

Files in This Item:
File Description SizeFormat 
000484047-Texto+Completo-0.pdfTexto Completo4,4 MBAdobe PDFOpen
View


All Items in PUCRS Repository are protected by copyright, with all rights reserved, and are licensed under a Creative Commons Attribution-NonCommercial 4.0 International License. Read more.