Reconhecimento de sons e voz
A tecnologia de reconhecimento de voz está se consolidando comercialmente e possibilitando sua utilização no mercado atual através de uma excelente relação custo/benefício. Este fato está fortemente atrelado a uma série de características que tornam o emprego desta nova tecnologia altamente atrativa.
No entanto existem muitas dúvidas e peculiaridades em torno deste assunto que nos parece muito obscuras, portanto neste trabalho tentaremos entender um pouco mais de como funciona, como é realizado a captação do som ou da voz, o processo de transformação de um sinal e como é efetuado esse entendimento entre homem – máquina.
2 REFERENCIAL TEÓRICO
2.1 DEFINIÇÃO
O reconhecimento de comandos de voz é um conjunto de hardwares e softwares específicos que possibilitam o gerenciamento e a otimização na execução de tarefas, podendo assim ser aplicado em vários segmentos. (PETRY, 2002).
A partir da voz, é possível identificar várias características de quem fala (idade, sexo, lugar onde mora, estado emocional, estado de saúde, etc.).
A voz é uma onda acústica, radiada do sistema quando o ar é expelido dos pulmões, por isso a voz é um som e possui todas as características sonoras do mesmo. Ela se propaga como ondas de pressão atmosférica e pode ser convertida em sinais elétricos por transdutores, como o alto-falante e os microfones.
Pesquisas no reconhecimento automático da fala por máquinas têm sido feitas por quase quatro décadas.
O sinal da fala é um sinal que varia lentamente no tempo e quando examinado num período de tempo suficientemente pequeno (entre 5 e 100 msec) suas características permanecem estacionárias. Entretanto em períodos longos de tempo (na ordem de 0.2 segundos ou mais) as características do sinal mudam para refletir os diferentes sons da fala. (SOUZA, REZENDE, SOUZA, 2011 p.11).
Ao contrário do que muitos pensam um sistema de reconhecimento de voz, reconhece a freqüência da voz e não a voz propriamente dita e é através do sinal da