Esta tese apresenta um conjunto de algoritmos para reconhecimento robusto de voz, que possibilitam realizar o reconhecimento da fala de forma mais adequada, combinando o processamento em banda única e o processamento em múltiplas bandas, e seus parâmetros tais como: tipo de banco de filtros, números de sub-bandas, etc ... A base é o algoritmo para identificar a natureza do ruído, que utilizado em conjunto com a estimação da sua potência, permite conduzir apropriadamente o reconhecimento. O algoritmo para identificação da natureza do ruído é realizado através de Hidden Markow Model (HMM) e os parâmetros extraídos são entropia espectral, taxa de cruzamentos por zero e log-energia de 16sub-bandas. Com o método proposto, para quatro possíveis tipos de ruído (branco, rosa, falatório e interior do carro), obtivemos 97,22% de correta identificação da natureza do ruído quando misturados com comandos de voz, e 100% quando o sinal é composto apenas por ruído. Documento

Visão geral