Utilize este identificador para citar ou criar um atalho para este documento: https://hdl.handle.net/10923/10787
Tipo: masterThesis
Título: Contributions in face detection with deep neural networks
Autor(es): Paula, Thomas da Silva
Orientador: Barros, Rodrigo Coelho
Editora: Pontifícia Universidade Católica do Rio Grande do Sul
Programa: Programa de Pós-Graduação em Ciência da Computação
Data de Publicação: 2017
Palavras-chave: VISÃO POR COMPUTADOR
REDES NEURAIS (COMPUTAÇÃO)
APRENDIZAGEM DE MÁQUINA
INFORMÁTICA
Resumo: Reconhecimento facial é um dos assuntos mais estudos no campo de Visão Computacional. Dada uma imagem arbitrária ou um frame arbitrário, o objetivo do reconhecimento facial é determinar se existem faces na imagem e, se existirem, obter a localização e a extensão de cada face encontrada. Tal detecção é facilmente feita por seres humanos, porém continua sendo um desafio em Visão Computacional. O alto grau de variabilidade e a dinamicidade da face humana tornam-a difícil de detectar, principalmente em ambientes complexos. Recentementemente, abordagens de Aprendizado Profundo começaram a ser utilizadas em tarefas de Visão Computacional com bons resultados. Tais resultados abriram novas possibilidades de pesquisa em diferentes aplicações, incluindo Reconhecimento Facial. Embora abordagens de Aprendizado Profundo tenham sido aplicadas com sucesso para tal tarefa, a maior parte das implementações estado da arte utilizam detectores faciais off-the-shelf e não avaliam as diferenças entre eles. Em outros casos, os detectores faciais são treinados para múltiplas tarefas, como detecção de pontos fiduciais, detecção de idade, entre outros. Portanto, nós temos três principais objetivos. Primeiramente, nós resumimos e explicamos alguns avanços do Aprendizado Profundo, detalhando como cada arquitetura e implementação funcionam. Depois, focamos no problema de detecção facial em si, realizando uma rigorosa análise de alguns dos detectores existentes assim como algumas implementações nossas. Nós experimentamos e avaliamos variações de alguns hiper-parâmetros para cada um dos detectores e seu impacto em diferentes bases de dados.Nós exploramos tanto implementações tradicionais quanto mais recentes, além de implementarmos nosso próprio detector facial. Por fim, nós implementamos, testamos e comparamos uma abordagem de meta-aprendizado para detecção facial, que visa aprender qual o melhor detector facial para uma determinada imagem. Nossos experimentos contribuem para o entendimento do papel do Aprendizado Profundo em detecção facial, assim como os detalhes relacionados a mudança de hiper-parâmetros dos detectores faciais e seu impacto no resultado da detecção facial. Nós também mostramos o quão bem features obtidas com redes neurais profundas — treinadas em bases de dados de propósito geral – combinadas com uma abordagem de meta-aprendizado, se aplicam a detecção facial. Nossos experimentos e conclusões mostram que o aprendizado profundo possui de fato um papel notável em detecção facial.
Face Detection is one of the most studied subjects in the Computer Vision field. Given an arbitrary image or video frame, the goal of face detection is to determine whether there are any faces in the image and, if present, return the image location and the extent of each face. Such a detection is easily done by humans, but it is still a challenge within Computer Vision. The high degree of variability and the dynamicity of the human face makes it an object very difficult to detect, mainly in complex environments. Recently, Deep Learning approaches started to be applied for Computer Vision tasks with great results. They opened new research possibilities in different applications, including Face Detection. Even though Deep Learning has been successfully applied for such a task, most of the state-of-the-art implementations make use of off-the-shelf face detectors and do not evaluate differences among them. In other cases, the face detectors are trained in a multitask manner that includes face landmark detection, age detection, and so on. Hence, our goal is threefold. First, we summarize and explain many advances of deep learning, detailing how each different architecture and implementation work. Second, we focus on the face detection problem itself, performing a rigorous analysis of some of the existing face detectors as well as implementations of our own. We experiment and evaluate variations of hyper-parameters for each of the detectors and their impact in different datasets. We explore both traditional and more recent approaches, as well as implementing our own face detectors. Finally, we implement, test, and compare a meta learning approach for face detection, which aims to learn the best face detector for a given image.Our experiments contribute in understanding the role of deep learning in face detection as well as the subtleties of changing hyper-parameters of the face detectors and their impact in face detection. We also show how well features obtained with deep neural networks trained on a general-purpose dataset perform on a meta learning approach for face detection. Our experiments and conclusions show that deep learning has indeed a notable role in face detection.
URI: http://hdl.handle.net/10923/10787
Aparece nas Coleções:Dissertação e Tese

Arquivos neste item:
Arquivo Descrição TamanhoFormato 
000485008-Texto+Completo-0.pdfTexto Completo10,35 MBAdobe PDFAbrir
Exibir


Todos os itens no Repositório da PUCRS estão protegidos por copyright, com todos os direitos reservados, e estão licenciados com uma Licença Creative Commons - Atribuição-NãoComercial 4.0 Internacional. Saiba mais.