Segmentação de pessoas em imagens estáticas baseada em esqueleto

Jacques Junior, Julio Cezar Silveira

Por favor, use este identificador para citar o enlazar este ítem: https://hdl.handle.net/10923/1499

Tipo:	doctoralThesis
Título:	Segmentação de pessoas em imagens estáticas baseada em esqueleto
Autor(es):	Jacques Junior, Julio Cezar Silveira
Orientador:	Musse, Soraia Raupp
Editor:	Pontifícia Universidade Católica do Rio Grande do Sul
Programa:	Programa de Pós-Graduação em Ciência da Computação
Fecha de Publicación:	2012
Palabras clave:	INFORMÁTICA PROCESSAMENTO DE IMAGENS SEMÂNTICA ESQUELETO
Resumen:	The segmentation of people (automatic or semi-automatic) in still images is a very challenging task, mainly due to several factors in the real world, such as those related to the lighting of the scene where the image was captured, shadows, image noise, occlusions, high similarity of the object of interest with the background of the scene and the lack of information inherent in depth when a scene is captured into a 2D image. In this work we present a skeleton-based model for human segmentation in still images. The input data of the model, related to the skeleton model, can be obtained automatically (using an algorithm for 2D pose estimation of people in images, for example) or manually (through user interaction), depending on the particular application. The skeleton model is used to guide the segmentation by taking into account color information, brightness, angle constraints and anthropometric parameters. In a general way, the main idea of the proposed approach is to build a graph around the skeleton model, for a given input image, and find out the best path in this graph that satisfies a certain condition (e. g., the one that maximizes a certain energy criterion), thus generating the contour of the person in the picture. It is also being proposed in this work an approach to measure quantitatively the experimental results, from information provided through user interaction. The experimental results demonstrate that the proposed model generates satisfactory results for non-trivial images containing people with varied appearances and poses (containing self-occlusions), in various complex environments (and uncontrolled), with different lighting conditions and image quality. The results obtained using the proposed model was also compared with those obtained by a work considered state of the art. Our experiments indicate that the proposed model adapts better to the contours, while the human body shape priors in the confronted work enforce a smoother contour. The proposed segmentation model generates a closed contour (for each person in the image) with semantic information included, (e. g., each contour point is associated with a particular body part), which can be used for various purposes (for example, construction of virtual humans with features extracted from the image, methods for clothes estimation in images, estimation of the human shape under the clothes, etc. ). A segmentação (automática ou semi-automática) de pessoas em imagens estáticas é uma tarefa bastante desafiadora, principalmente devido a diversos fatores do mundo real, como por exemplo, fatores relacionados à iluminação da cena onde a imagem foi capturada, sombras, ruídos na imagem, oclusão, alta similaridade do objeto de interesse com o fundo da cena e a falta de informação inerente de profundidade quando uma cena é capturada em uma imagem 2D. Nessa tese é apresentado um modelo para segmentação de pessoas em imagens baseado em esqueleto. Os dados de entrada para o modelo proposto, associados ao modelo de esqueleto, podem ser obtidos de forma automática (utilizando um algoritmo para estimativa de pose 2D de pessoas em imagens, por exemplo) ou manual (através de interação com usuário), dependendo da aplicação em questão. O modelo de esqueleto guia a segmentação da pessoa na imagem levando em consideração informações de cor, luminosidade, restrições de ângulos e parâmetros antropométricos. De uma forma geral, a idéia principal da abordagem proposta é construir um grafo ao redor do modelo de esqueleto, para uma determinada imagem de entrada, e buscar o melhor caminho nesse grafo que satisfaça uma determinada condição (por exemplo, aquela que maximiza certo critério de energia), gerando assim o contorno da pessoa na imagem. Também está sendo proposta nessa tese uma abordagem para avaliar quantitativamente os resultados experimentais obtidos, a partir de informações fornecidas através de interação com usuário. Os resultados experimentais demonstram que o modelo proposto gera resultados satisfatórios para imagens não triviais, contendo pessoas com aparências e poses variadas (podendo haver membros parcialmente ocultos), em diversos ambientes complexos (e não controlados), com diferentes iluminações e qualidade de imagem, entre outros fatores. Os resultados obtidos com a utilização do modelo proposto também foram comparados com os obtidos por um trabalho considerado estado-daarte e os experimentos indicam que o nosso modelo gera resultados mais coerentes para o contorno da pessoa, enquanto que os contornos obtidos pelo trabalho em questão apresentam formas mais suaves.O modelo de segmentação proposto é capaz de gerar um contorno fechado (para cada pessoa na imagem) contendo informação semântica, ou seja, cada ponto do contorno resultante está associado a uma determinada parte do corpo, que pode ser utilizada para diversos fins (por exemplo, construção de humanos virtuais com características extraídas da imagem, métodos para estimativa de roupas em imagens, estimativa da forma humana sobre as roupas, entre outros).
URI:	http://hdl.handle.net/10923/1499
Aparece en las colecciones:	Dissertação e Tese

Ficheros en este ítem:

Fichero	Descripción	Tamaño	Formato
000439268-Texto+Completo-0.pdf	Texto Completo	3,75 MB	Adobe PDF	Abrir Ver

Mostrar el registro completo del ítem Ver estatísticas Busque otras versiones de este texto através de SFX

Todos los ítems en el Repositorio de la PUCRS están protegidos por derechos de autor, con todos los derechos reservados, y están bajo una licencia de Creative Commons Reconocimiento-NoComercial 4.0 Internacional. Sepa más.