Beruflich Dokumente
Kultur Dokumente
EXAMEN PROBATOIRE
Spécialité : INFORMATIQUE
APPR OC HE D E
LA RECONNAISSANCE AUT OM ATIQUE
DE LA PAROLE
SOMMAIRE
Introduction …………………………………………… p. 4
1. Définition …………………………………………… p. 5
2. Historique ………………………………………… p. 6
2.1. La naissance …………………………………… p. 6
2.2. Les premiers mots ……………………………. .. p. 6
2.3. L’avancée des années 70 ………………………. p. 7
2.4. La reconnaissance du langage ………………… p. 8
2.5. Dates clés ………………………………………… p. 8
4. Applications …………………………………….. p. 16
4.1. Services vocaux ……………………………….… p. 16
4.2. Contrôle de qualité, saisie des données ……... p. 16
4.3. Avionique ………………………………………… p. 17
4.4. Formation ………………………………………… p. 18
4.5. Aide aux handicapés …………………………… p. 18
4.6. Dictée vocale ……………………………………. p. 19
4.7. Et aussi … ……………………………………….. p. 20
5. Conclusion ………………………………………. p. 21
Annexes …………………………………………….. p. 22
A – Glossaire …………………………………………. p. 22
Page 3
Approche de la reconnaissance automatique de la parole
Rapport cycle probatoire, CNAM, Année 2003
INT RODUCT IO N
Page 4
Approche de la reconnaissance automatique de la parole
Rapport cycle probatoire, CNAM, Année 2003
1. DEFINIT IO N
La reconnaissance automatique de la parole est l’un des deux
domaines du traitement automatique de la parole, l’autre étant la synthèse
vocale. La reconnaissance automatique de la parole permet à la machine
de comprendre et de traiter des informations fournies oralement par un
utilisateur humain. Elle consiste à employer des techniques d'appariement
afin de comparer une onde sonore à un ensemble d'échantillons, composés
généralement de mots mais aussi, plus récemment, de phonèmes (unité
sonore minimale : voir plus loin). En revanche, le système de synthèse de
la parole permet de reproduire d’une manière sonore un texte qui lui est
soumis, comme un humain le ferait.
Page 5
Approche de la reconnaissance automatique de la parole
Rapport cycle probatoire, CNAM, Année 2003
2. HIST ORIQ UE
Ce chapitre va montrer l’évolution de la reconnaissance automatique
de la parole depuis ses débuts jusqu’à nos jours.
2.1. La naissance
Page 6
Approche de la reconnaissance automatique de la parole
Rapport cycle probatoire, CNAM, Année 2003
Page 7
Approche de la reconnaissance automatique de la parole
Rapport cycle probatoire, CNAM, Année 2003
Page 8
Approche de la reconnaissance automatique de la parole
Rapport cycle probatoire, CNAM, Année 2003
Page 9
Approche de la reconnaissance automatique de la parole
Rapport cycle probatoire, CNAM, Année 2003
3.1. Problématique
Pour bien appréhender le problème de la reconnaissance
automatique de la parole, il est bon d'en comprendre les différents niveaux
de complexité et les différents facteurs qui en font un problème difficile.
Page 10
Approche de la reconnaissance automatique de la parole
Rapport cycle probatoire, CNAM, Année 2003
3.2. Fonctionnement
Le problème de la reconnaissance automatique de la parole consiste
à extraire l'information contenue dans un signal de parole, typiquement par
échantillonnage du signal électrique obtenu à la sortie d’un microphone, afin
qu’il puisse être comparé à des modèles sous forme numérique. Parmi
plusieurs techniques de reconnaissance, il y en a deux qui sont
majoritairement utilisées afin de parvenir à résoudre ce problème : la
comparaison à des exemples et la comparaison d’unités de parole.
Page 11
Approche de la reconnaissance automatique de la parole
Rapport cycle probatoire, CNAM, Année 2003
Page 12
Approche de la reconnaissance automatique de la parole
Rapport cycle probatoire, CNAM, Année 2003
Page 13
Approche de la reconnaissance automatique de la parole
Rapport cycle probatoire, CNAM, Année 2003
Page 14
Approche de la reconnaissance automatique de la parole
Rapport cycle probatoire, CNAM, Année 2003
Parole
Acquisition et modélisation
Traitement canal de
transmission
Hypothèses phonétiques
Propositions lexicales
Contraintes syntaxiques
Parole reconnue
Page 15
Approche de la reconnaissance automatique de la parole
Rapport cycle probatoire, CNAM, Année 2003
4. APPLICATIONS
Ce chapitre va survoler les différentes possibilités d’appliquer la
reconnaissance automatique de la parole.
Page 16
Approche de la reconnaissance automatique de la parole
Rapport cycle probatoire, CNAM, Année 2003
4.3. Avionique
A bord des avions, les tâches étant de plus en plus complexes et le
tableau de bord de plus en plus réduit, la parole permet au pilote d’avoir à
sa disposition un moyen supplémentaire d’interaction avec la machine, sans
cependant gêner l’accomplissement des tâches courantes qui requièrent de
sa part toute son attention visuelle. Les autorités canadiennes ont été les
précurseurs des techniques vocales dans l’avionique.
Page 17
Approche de la reconnaissance automatique de la parole
Rapport cycle probatoire, CNAM, Année 2003
4.4. Formation
Les enfants, mais aussi les adultes, sont attirés par des jeux doués
de parole (poupées qui parlent, jeux de société, jeux vidéos, jeux éducatifs).
L’enseignement assisté par ordinateur et notamment les laboratoires de
langue commence à intégrer de plus en plus de possibilités vocales, et
évolue vers une interactivité plus grande : les systèmes d’aide à
l’apprentissage des langues étrangères, permettant d’acquérir une
prononciation correcte, une maîtrise du vocabulaire et de la syntaxe, ne
peuvent que bénéficier des technologies vocales qui leur confèrent en outre
un aspect ludique.
Du côté des applications proprement dites, la société Auralog® a été
précurseur avec ses logiciels d’apprentissage de langues (TeLL me More® ,
Atout Clic Anglais® ). Ainsi, grâce à la technologie avancée de la
reconnaissance vocale, l’utilisateur engage un véritable dialogue avec son
PC. Suivant son niveau, l’apprenant paramètre la reconnaissance vocale
pour la rendre plus tolérante ou plus exigeante quant à la qualité de sa
prononciation. L’utilisateur s’entraîne à prononcer une phrase ou un mot et
obtient un score lui permettant d’évaluer la qualité de son accent, de sa
prononciation et de son intonation.
Page 18
Approche de la reconnaissance automatique de la parole
Rapport cycle probatoire, CNAM, Année 2003
Page 19
Approche de la reconnaissance automatique de la parole
Rapport cycle probatoire, CNAM, Année 2003
4.7. Et aussi …
Page 20
Approche de la reconnaissance automatique de la parole
Rapport cycle probatoire, CNAM, Année 2003
CONCL USIO N
Enfin, une dernière révolution se prépare : celle qui verra naître des
machines dont plus personne ne pourra affirmer avec certitude qu’elles en
sont. Aujourd’hui déjà, la qualité des algorithmes de synthèse vocale permet
aux synthétiseurs de passer avec succès le «test de Turing», inventé par le
mathématicien anglais Alan Turing dans les années 40 pour mesurer le
degré d’«intelligence» d’une machine : en vérifiant combien de temps un
expérimentateur interagissant «en aveugle» avec cette machine peut rester
persuadé d’avoir affaire à un être humain. La reconnaissance est aussi
prête à tromper notre intelligence, et ne manquer a pas de continuer à le
faire, dès lors que l’on aura amélioré ses capacités de robustesse.
Il n’en reste pas moins que, alors que nos ordinateurs pourront nous parler
et reconnaître ce que nous leur dirons, ils n’en seront pas pour autant
capables de comprendre nos paroles. C’est là un tout autre domaine, dont
nous ne connaissons encore que les tous premiers balbutiements.
Page 21
Approche de la reconnaissance automatique de la parole
Rapport cycle probatoire, CNAM, Année 2003
Annexe A : Glossaire
Bit : Abréviation de «BInary digiT», mais bit signifie «un peu», «un bout» en
anglais. Unité élémentaire d'information, ne pouvant prendre que deux valeurs,
représentées par 0 et 1 en général (ou Faux et Vrai).
Phonème : Unité qui permet de caractériser tous les sons d’une langue. La
plupart des langues comportent moins d’une centaine de phonèmes. Par exemple
«a», «è», «ss», etc…
Page 22
Approche de la reconnaissance automatique de la parole
Rapport cycle probatoire, CNAM, Année 2003
Références bibliographiques :
Références Internet :
http://www.hbroussais.fr/Broussais/InforMed/InforSante/Volume4/pdf4/4-8.pdf :
Publication du Centre Scientifique IBM – France
http://tcts.fpms.ac.be/cours/1005-08/speech/parole.pdf : Introduction au
Traitement Automatique de la Parole
http://www-
geod.imag.fr/jcaelen/cours%20accessibles_fichiers/Cours%20Reco.htm :
Publication du CLIPS (Communication Langagière et interaction Personne-
système)
Page 23