Reconhecimento de palavras isoladas atraves das redes mlp e som, utilizando mfcc e wavelet em ambientes ruidosos

2910 palavras 12 páginas
1

Reconhecimento de palavras isoladas através das redes MLP e SOM, utilizando MFCC e Wavelet em ambientes ruidosos.
Gilliard Alan de Melo Lopes, Hesdras Oliveira Viana.
 Abstract – The speech recognition is based on the extraction of features for such aspects as noise and size coefficients should be analyzed to characterize the voice. The present articles compare the techniques between MFCC and Wavelet classified with neural network MLP and SOM in noise environment. Keywords – MFCC, Wavelet, MLP, SOM, Daubechies, Biortogonal, Descritores, Classificadores.

II. DESCRITORES A escolha da melhor característica da voz (atributo) é importante no desenvolvimento de um reconhecedor de voz. O principal objetivo dessas técnicas é a eliminação de informação irrelevante com respeito a análise fonética dos dados e a enfatização dos aspectos do sinal da fala que contribuem significativamente para a detecção das diferenças fonéticas. A. MFCC Os coeficientes Mel-cepestrais surgiram devido aos estudos na área de psicoacústica (ciência que estuda a percepção auditiva humana), que mostraram que a percepção humana das freqüências de tons puros ou de sinais de voz não segue uma escala linear. Isto estimulou a idéia de serem definidas freqüências subjetivas de tons puros, da seguinte forma: para cada tom com freqüência f, medida em Hz, define-se um tom subjetivo medido em uma escala que se chama escala mel. O mel, então, é uma unidade de medida da frequência percebida de um tom [7]. Com isso, definiu-se frequência de 1 kHz com potência 40 dB acima do limiar mínimo de audição do ouvido humano como 1000 mels. Graças a ponderação da escala de frequência para a escala mel, pode-se identificar a banda crítica, que são sons não individualmente identificados, dentro de certas bandas, pelo ouvido humano. A equação (1) faz a conversão de Hz para Mel e a equação (2) de Mel para Hz respectivamente. (1) – (2)

I.

INTRODUÇÃO

reconhecimento da fala é o processo de codificação do sinal da voz

Relacionados