Sie sind auf Seite 1von 4

Detección De Voz Con Ruido Fuerte En Tiempo Real

Washington Quisperima Galdos Carlos Felipe Anco Llamocca Joel David Iparraguirre Tamariz
Facultad de Ingeniera Electronica Facultad de Ingeniera Electronica Facultad de Ingeniera Electronica
washingtonqgaldos@unmsm.edu.pe carlos.anco@unmsm.edu.pe joel.iparraguirre@unmsm.edu.pe

Resumen: Esta investigación explora la eficacia y [3] C.Ganesh Babu, P.T.Vanathi Análisis de rendimiento de
aplicación de diversas técnicas resistentes al ruido logaritmos de detección de actividad de voz para el
en tiempo y entorno real. También analiza las reconocimiento de solido de voz.International Journal of
Computing Science and Communication Technologies,
diferentes propiedades del habla que serían útiles
VOL. 2,2009
para diferenciarlo del ruido en diversos entornos
de ruido todo esto aprovechado para desarrollar [4] K. Yamamoto, F. Jabloun, K. Reinhard, A.
un algoritmo de detección de gritos optimizado Kawamura.Deteccion final sólida para el reconocimiento de
para la aplicación de un montacargas voz basado en la extracción de características
automatizado. discriminativas. In Proc.ICASSSP, 2006.

Palabras clave: Detección, voz, ruido, señal,


procesamiento. [5] Y. Gong. Speech Recognition in Noise Environments: A
Survey. Speech Communication, 16.3:261-291, 1995.
I. INTRODUCCIÓN

A lo largo de los años ha habido un progreso


considerable en el campo del reconocimiento
del habla, lo que resulta benéfico para el
desarrollo de aplicaciones específicas en
distintos ambientes. Por ejemplo se logró una
tasa de error de palabra inferior al 1% en un
sistema de altavoz independiente de
reconocimiento de palabras con una base de
datos de vocabulario de más de 20.000 palabras
[1], aunque fue en un ambiente silencioso ideal.
Otro avance es el reconocimiento de voz en una
emisión de audio en base a la segmentación
homogénea del audio evaluando el habla, la
fluidez y su espectro [2]. En la ejecución de un
discurso el sistema puede mejorar
drásticamente al integrar un módulo VAD
(detección de actividad de voz) al sistema
[3].Un VAD preciso reduce el tiempo de
respuesta y el cálculo en los sistemas de
reconocimiento de voz ya que solo se analizan
los tramos de voz detectados en su algoritmo de
reconocimiento [4]. Con los resultados y el
conocimiento recopilado sobre las
características investigadas y las técnicas de
mejora del habla, esta sección presenta el
algoritmo de detección de grito robusto (RSDA)
[5].

REFERENCIAS
[1]S. Das, R. Bakis, A. Nadas, D. Nahamoo, M. Picheny.
Influencia del fondo
Ruido y micrófono en el rendimiento de la IBM
Tangora Speech Recognition
System. In Proc. ICASSP, 1993.

2] Unal Zubari, Ezgi Can Ozan, Banu Oskay Acar,


Detección del habla en la emisión del audio.Transactions on
audio, speech and language processing, vol 23, 2015.

Das könnte Ihnen auch gefallen