Análise qualitativa/quantitativa de algoritmos para a compressão de voz aplicados a redes de pacotes

Becker, Ricardo

Utilize este identificador para citar ou criar um atalho para este documento: https://hdl.handle.net/10923/3174

Tipo:	masterThesis
Título:	Análise qualitativa/quantitativa de algoritmos para a compressão de voz aplicados a redes de pacotes
Autor(es):	Becker, Ricardo
Orientador:	Fagundes, Rubem Dutra Ribeiro
Editora:	Pontifícia Universidade Católica do Rio Grande do Sul
Programa:	Programa de Pós-Graduação em Engenharia Elétrica
Data de Publicação:	2009
Palavras-chave:	ENGENHARIA ELÉTRICA PROCESSAMENTO DE SINAIS - TÉCNICAS DIGITAIS PROCESSAMENTO DE VOZ TRANSMISSÃO DE SINAIS ALGORITMOS
Resumo:	This work aims at the study, implementation and evaluation of techniques for voice compression, based on detection of periods of silence, applied to packet networks. For that, were studied the fundamental concepts of digital signal processing, including applications and mathematical models. After that, were studied the transmission systems of voice signals by packet networks, in essence, Voice over IP (VoIP) systems. In this context, this work proposed the implementation of six techniques for compression of voice based on the combination of different algorithms using the detection of periods of silence in speech. Among the algorithms used, were done analysis of voice signal in time and frequency domain considering the analysis of energy content on voice signal, and also, the analysis of fricative sounds in speech, and the application of techniques for coating and for compensation by comfort noise. To implement the techniques, it was developed computational tools for testing, those were also used for evaluation and to compare the results using P. 800 (MOS) and P. 862 (PESQ) recommendations of ITU-T. Both, MOS and PESQ are accepted as techniques for assessing the quality of the voice signal perceived in telecommunications systems. Finally, the results and conclusions, as we can see results of bandwidth economy provided to networks, and the level of degradation of voice signal provided by the application of techniques, at the same time without compromising the system with high computational demands. We verify that in terms of bandwidth economy and quality of the audio provided by LSED, SFD and CVAD techniques, all of them, implemented in frequency domain with satisfactory results, as well as LED and ALED techniques, implemented in time domain, which also were not far behind in terms of overall results. Finally, it is suggested a number of possibilities for continuing the work and also improvements to applications in different subjects. Este trabalho tem por objetivo o estudo, implementação e avaliação de técnicas de compressão de voz, baseadas na detecção de períodos de silêncio, aplicadas a redes de pacotes. Para tanto, foram estudados os conceitos fundamentais de processamento digital de sinais, incluindo aplicações e modelos matemáticos. Posteriormente, estudou-se a estrutura dos sistemas de transmissão de sinais de voz via redes de pacotes, em essência, sistemas de Voz sobre IP (VoIP). Nestes sistemas, foram vistas a aplicabilidade e princípios de funcionamento dos componentes de DSP, desde a própria compressão da voz, baseada nos períodos de silêncio, bem como padrões de codificação, cancelamento de eco, controle automático de ganho e geração de ruído de conforto. Posteriormente é proposta então a implementação de seis técnicas de compressão de voz baseadas na combinação de diferentes algoritmos aplicados na detecção de períodos de silêncio ou não da fala. Dentre os algoritmos aplicados, está a análise no tempo e em frequência do conteúdo de energia do sinal de voz, a análise do sinal na busca dos sons fricativos da fala, e ainda aplicação de recobrimento e compensação por ruído de conforto. Para a implementação das técnicas foram desenvolvidas ferramentas computacionais de testes, e para fins de validação e comparação dos resultados foram utilizadas, com as devidas adaptações, e descritas no trabalho, as recomendações P. 800 (MOS) e P. 862 (PESQ) do ITU-T, sendo estas entre as mais reconhecidas em termos de avaliação da qualidade do sinal de áudio percebido em sistemas de telecomunicações. Por fim, são apresentados os resultados e as conclusões, onde nos mesmos buscava-se um compromisso das implementações entre percentual estimado de economia de banda proporcionada a redes de pacotes, e nível de degradação do sinal de voz proporcionado pela aplicação da compressão, ao mesmo tempo em que sem comprometimento com alta demanda computacional do sistema. Neste sentido, se verificou que em termos de economia de banda proporcionada e qualidade do áudio, as técnicas LSED, SFD e CVAD, todas implementadas no domínio frequência, apresentaram resultados bastante satisfatórios, assim como a LED e ALED, implementadas no domínio do tempo, que também não ficaram muito atrás em termos de resultados gerais. Também ficou claro o efeito da aplicação do recobrimento e da compensação por ruído de conforto amostrado do próprio microfone do locutor. Por fim, sugere-se um número de possibilidades para a continuidade do trabalho, bem como evolução dos mesmos, tanto em termos de melhorias quanto na diversificação das aplicações dos resultados.
URI:	http://hdl.handle.net/10923/3174
Aparece nas Coleções:	Dissertação e Tese

Arquivos neste item:

Arquivo	Descrição	Tamanho	Formato
000414179-Texto+Completo-0.pdf	Texto Completo	2,39 MB	Adobe PDF	Abrir Exibir

Ver em formato completo Ver estatísticas Busque outras versões desse texto via SFX

Todos os itens no Repositório da PUCRS estão protegidos por copyright, com todos os direitos reservados, e estão licenciados com uma Licença Creative Commons - Atribuição-NãoComercial 4.0 Internacional. Saiba mais.