Beruflich Dokumente
Kultur Dokumente
Procesamiento
Reconocimiento de voz (1 de 3)
Frecuencia de señal analógica de entrada. espectrograma(el micrófono graba la voz) (por
ejemplo, transformada de Fourier)Hztiempo
Reconocimiento de voz (2 de 3)
Espectrograma de frecuenciaSonidos básicos en la señal (40-50 fonemas) (p. Ej., “A” en
“cat”)Coincidencia de plantillas contra db de fonemasUso de distorsión de tiempo dinámica
(velocidad del habla)Construcción de palabras de fonemas ( por ejemplo, "th" + "i" + "ng"
= cosa)Fonemaspocofiables / probabilísticos (por ejemplo, "th" 50%, "f" 30%,
...)Pronunciaciones no únicas (por ejemplo, tomate),estadísticas de transiciones fonemas /
palabras (modelos ocultos de Markov)Palabras
Análisis sintáctico -
Oracióngramatical-> noun_phrase, verb_phrasenoun_phrase ->
proper_nounnoun_phrase -> determiner, sustantivoverb_phrase -> verb,
noun_phraseproper_noun -> [mary]noun -> [apple]verb - - [ate]determiner -> [the