Utilize este identificador para citar ou criar um atalho para este documento: https://hdl.handle.net/10923/12313
Tipo: masterThesis
Título: Analisando a viabilidade de deep learning para reconhecimento de ações em datasets pequenos
Autor(es): Santos Junior, Juarez Monteiro dos
Orientador: Barros, Rodrigo Coelho
Editora: Pontifícia Universidade Católica do Rio Grande do Sul
Programa: Programa de Pós-Graduação em Ciência da Computação
Data de Publicação: 2018
Palavras-chave: REDES NEURAIS (COMPUTAÇÃO)
APRENDIZADO DO COMPUTADOR
Resumo: Reconhecimento de ação é a tarefa de visão computacional que identifica qual ação esta ocorrendo em dada sequência de frames. Abordagens tradicionais dependem de características extraídas dessas imagens e algoritmos específicos de domínio, muitas vezes resultando em uma precisão limitada. Os avanços substanciais na aprendizagem profunda e a disponibilidade de conjuntos de dados maiores permitiram que técnicas produzam um desempenho sem conhecimento específico do domínio para reconhecer as ações que estão sendo realizadas, tendo como base apenas sequências de vídeo. No entanto, os algoritmos de aprendizagem profunda geralmente requerem conjuntos de dados rotulados muito grandes para o treinamento. Devido à sua maior capacidade, tais algoritmos geralmente sofrem com overfitting em conjunto de dados pequenos, proporcionando assim um menor poder de generalização. Este trabalho tem como objetivo explorar a aprendizagem profunda no contexto de conjuntos de dados pequenos para reconhecimento de ações. Nosso objetivo é alcançar resultados, mesmo nos casos em que os dados rotulados não sejam abundantes. Para isso, investigamos diferentes arquiteturas profundas, diferentes métodos de processamento, e diferentes métodos de fusão, fornecendo diretrizes e boas práticas para o aprendizado profundo em conjuntos de dados de tamanho pequeno.
Action recognition is the computer vision task of identifying which action is happening in a given sequence of frames. Traditional approaches rely on handcrafted features and domain specific algorithms, often resulting in limited accuracy. The substantial advances in deep learning and the availability of larger datasets have allowed techniques that yield better performance without domain-specific knowledge to recognize actions being performed based on the raw information from video sequences. However, deep learning algorithms usually require very large labeled datasets for training, and due to their increased capacity their often overfit small data, hence providing lower generalization power. This work aims to explore deep learning in the context of small-sized action recognition datasets. Our goal is to achieve significant performance even in cases in which labeled data is not abundant. In order to do so, we investigate distinct network architectures, data pre-processing, and fusion methods, providing guidelines and good practices for using deep learning in small-sized datasets.
URI: http://hdl.handle.net/10923/12313
Aparece nas Coleções:Dissertação e Tese

Arquivos neste item:
Arquivo Descrição TamanhoFormato 
000489459-Texto+Completo-0.pdfTexto Completo4,7 MBAdobe PDFAbrir
Exibir


Todos os itens no Repositório da PUCRS estão protegidos por copyright, com todos os direitos reservados, e estão licenciados com uma Licença Creative Commons - Atribuição-NãoComercial 4.0 Internacional. Saiba mais.