Sie sind auf Seite 1von 74

Projet de Fin d'tudes

Pour l'obtention du diplme


Master specialis
<<Ingnierie Informatique>>

Sy nthse Vocale en Darija


IHYA TAR

EK

32

Devant le jury :
Pr Ali EL MERZOUQI (Encadrant)

Pr M. L. Ben Mati

Anne universitaire 2015-2016

Pr Badr Eddine El Mohajir

56

Pl

an

SOFT CENTRE
Synthse Vocale
MaryTTS
Portage du darija
Dmonstartion
Conclusion

Synthse vocale en Darija

IHYA Tarek

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

SOFT CENTRE

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

SOFT CENTRE

Prsentation
Un centre de dveloppement logiciel mis disposition
des oprateurs du secteur de lIndustrie des Technologies
de lInformation.
Cr en 2010 et prsid par lANRT.

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

SOFT CENTRE

Prsentation
Un centre de dveloppement logiciel mis disposition
des oprateurs du secteur de lIndustrie des Technologies
de lInformation.
Cr en 2010 et prsid par lANRT.

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

SOFT CENTRE

Mission
Exploiter les comptences universitaires dans le but de
la production du logiciel innovant moindre cot.
Gnrer des projets de recherche et dveloppement logiciel
la demande

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

SOFT CENTRE

Mission
Exploiter les comptences universitaires dans le but de
la production du logiciel innovant moindre cot.
Gnrer des projets de recherche et dveloppement logiciel
la demande

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Synthse vocale

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Synthse vocale

Dfinition
Crer de la parole artificielle partir dun texte donne
Souvent associe avec la technologie de la reconnaissance
vocale

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Synthse vocale

Dfinition
Crer de la parole artificielle partir dun texte donne
Souvent associe avec la technologie de la reconnaissance
vocale

10

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Synthse vocale

Applications
Assister les personnes aveugles ou fortement malvoyantes.
Pour assister les personnes muettes et ceux qui ont perdu
leurs voix.
Autres

11

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Synthse vocale

Applications
Assister les personnes aveugles ou fortement malvoyantes.
Pour assister les personnes muettes et ceux qui ont perdu
leurs voix.
Autres.

12

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Synthse vocale

Applications
Assister les personnes aveugles ou fortement malvoyantes.
Pour assister les personnes muettes et ceux qui ont perdu
leurs voix.
Autres.

13

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Synthse vocale

Comment marche-t-elle
Composant de traitement automatique de la langue.
Composant de traitement du signal numrique.

14

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Synthse vocale

Comment marche-t-elle
Composant de traitement automatique de la langue.
Composant de traitement du signal numrique.

15

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Synthse vocale

Mthodes de synthse vocale


Synthse par rgles.
Synthse par concatnation dunits.

16

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Synthse vocale

Mthodes de synthse vocale


Synthse par rgles.
Synthse par concatnation dunits.

17

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Synthse vocale

Synthse par concatnation dunits


Mise bout bout de segments de paroles enregistrs ayant
une dure dfinie par les technologies.

La qualit du rsultat final est naturelle et intelligible

18

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Synthse vocale

Synthse par concatnation dunits


Mise bout bout de segments de paroles enregistrs ayant
une dure dfinie par les technologies.

La qualit du rsultat final est naturelle et intelligible

19

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Synthse vocale

Synthse par concatnation dunits


Synthse par MMC.
Synthse par slectionne dunits.
Autres.

20

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Synthse vocale

Synthse par concatnation dunits


Synthse par MMC.
Synthse par slectionne dunits.
Autres.

21

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Synthse vocale

Synthse par concatnation dunits


Synthse par MMC.
Synthse par slectionne dunits.
Autres.

22

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Synthse vocale

Synthse par MMC


Bas sur les Modles de Markov Cachs.
2h ou 3h denregistrements sont suffisantes.
Ne conserve pas la voix originale.
Voix flexible.

23

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Synthse vocale

Synthse par MMC


Bas sur les Modles de Markov Cachs.
2h ou 3h denregistrements sont suffisantes.
Ne conserve pas la voix originale.
Voix flexible.
24

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Synthse vocale

Synthse par MMC


Bas sur les Modles de Markov Cachs.
2h ou 3h denregistrements sont suffisantes.
Ne conserve pas la voix originale.
Voix flexible.
25

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Synthse vocale

Synthse par MMC


Bas sur les Modles de Markov Cachs.
2h ou 3h denregistrements sont suffisantes.
Ne conserve pas la voix originale.
Voix flexible.
26

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Synthse vocale

Vue densemble de la synthse HMM.


27

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Synthse vocale

Synthse par slectionne dunits


Taille de la voix est grande.
Il faut au moins 20h denregistrements.
Conserve la voix originale.
La voix nest pas flexible.
28

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Synthse vocale

Synthse par slectionne dunits


Taille de la voix est grande.
Il faut au moins 20h denregistrements.
Conserve la voix originale.
La voix nest pas flexible.
29

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Synthse vocale

Synthse par slectionne dunits


Taille de la voix est grande.
Il faut au moins 20h denregistrements.
Conserve la voix originale.
La voix nest pas flexible.
30

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Synthse vocale

Synthse par slectionne dunits


Taille de la voix est grande.
Il faut au moins 20h denregistrements.
Conserve la voix originale.
La voix nest pas flexible.

31

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Synthse vocale

Synthse par slectionne dunits


32

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

MaryTTS

33

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Synthse vocale

Prsentation
Le projet a t initi en 2000 par Marc shrder du labo
DFKI et Jrgen trouvain de linstitute de phontiques de
luniversit de Saarland
Cration un synthtiseur vocale facile utiliser, destin tout le
monde

34

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Synthse vocale

Prsentation
Le projet a t initi en 2000 par Marc shrder du labo
DFKI et Jrgen trouvain de linstitute de phontiques de
luniversit de Saarland
Cration un synthtiseur vocale facile utiliser, destin
tout le monde

35

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Synthse vocale

Prsentation(2)
Ecrit entierement en Java.
Il dispose de deux interfaces : un GUI Java, et une interface web

36

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Synthse vocale

Prsentation(2)
Ecrit entierement en Java.
Il dispose de deux interfaces : un GUI Java, et une interface web

37

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Synthse vocale

Architecture
Une architecture modulaire.
Un langage de balise bas sur XML

38

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Synthse vocale

Architecture
Une architecture modulaire.
Un langage de balise bas sur XML

39

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Synthse vocale

Architecture(2)
Il permet de voir loutput de chaque module pour lanalyser
et le modifier si on le veut.

40

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Portage de la Darija

41

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Portage de la Darija

Ecriture de la darija
La darija nest pas une langue, cest un dialecte.
Il nexiste aucune standard dcriture pour la darija.

42

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Portage de la Darija

Ecriture de la darija
La darija nest pas une langue, cest un dialecte.
Il nexiste aucune standard dcriture pour la darija.

43

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Portage de la Darija

Ecriture de la darija
En lettres arabes.
En lettres latins et des chiffres.

44

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Portage de la Darija

Ecriture de la darija
En lettres arabes.
En lettres latins et des chiffres.

45

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Portage de la Darija

Pub en darija, ici elle est crite en


lettres arabes
46

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Portage de la Darija

Pub en darija, ici elle est crite en


lettres latins et des chiffres
47

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Portage de la Darija

La mme phrases crites par les deux normes


48

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Portage de la Darija

Ecriture de la darija en Arabe


La diffrence entre la darija et larabe standard modern est :
Il y a 3 phonmes de larabe qui nexistent pas en darija
Il y a 4 phonmes dans la darija qui nexistent pas dans
larabe

49

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Portage de la Darija

Les sons de larabe quon ne trouve


pas dans la darija

50

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Portage de la Darija

Les sons non arabe de la darija

51

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Portage de la Darija

Les sons non arabe de la darija

52

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Portage de la Darija

Ecriture de la darija en Latin+chiffres


La diffrence entre la darija et la norme d'criture Latin+chiffres est :
Il y a 11 phonmes de la darija qui nexistent pas en Latin
Tout les phonmes en latin ont leurs equivalents en Darija

53

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Portage de la Darija

Les sons non latin de la darija


54

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Portage de la Darija

Cration du synthtiseur par MMC

55

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Portage de la Darija

Cration du synthtiseur par MMC


Script Segment en phrases
Sous format audio, et crit.

56

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Portage de la Darija

Cration du synthtiseur par MMC


Audio : des fichiers .wav Mono avec comme frquence
dchantillonage 16000 Hz
Ecrit : des fichiers .txt

57

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Portage de la Darija

Cration du synthtiseur par MMC


Corpus utilis :
Contes Marocaine crite en Arabe dcritis .
1000 phrases.(trop long)

58

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Portage de la Darija

Optimisation du Script
Cration d'un Algorithme glouton.
Couvrire tout les triphones du corpus original ainsi que leur
frquence

59

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Portage de la Darija

Optimisation du Script
Rduction du script 500 phrases .
1H et 15 minutes d'enregistrement.

60

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Portage de la Darija

Phontisation
Un phontiseur semi-automatique de Mary .
Dvelopp notre propre phontiseur, quon a integr aux
autres modules.

61

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Portage de la Darija

Labellisation
Cration de fichiers lab partir des fichiers audio et des
fichiers textes.
La qualit des fichiers lab a un influence directe sur la qualit
des voix cres.

62

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Portage de la Darija

Labellisation
Labellisation la main :Demande beaucoup de ressources
humaines
Labels de trs bonne qualit.

63

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Portage de la Darija

Labellisation
Labellisation automatique :Rapide et ne demande pas de
ressources humaines
Labels d'une qualit acceptable.

64

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Portage de la Darija

Cration du synthtiseur par


Slection d'units

65

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Portage de la Darija

Cration du synthtiseur par SU


Utilisation du premier Script
Besoin d'amelioration.

66

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Portage de la Darija

Cration du synthtiseur par SU


Utilisation d'algorithme Viterbi
Changement d'unit lmentaire :
Diphone+Contexte=Quadriphone

67

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Portage de la Darija

Cration du synthtiseur par SU


Etude Benchmar :
Utilisation d'un jeu de test.

68

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Portage de la Darija

Mots compris

69

Mots incompris

Mots peu compris

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Portage de la Darija

Cration du synthtiseur par SU


Etude Benchmark :
Pour qu'un quadriphone soit bien prenonc il faut avoir un
frequence de 5 ou plus

70

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Portage de la Darija

Cration du synthtiseur par SU


Optimisation du Script :
Parmi les 8602 quadriphones du 500 phrases seulement 495
quadriphones ont une frquence de 5 ou plus .
2500 prnoms marocains phonetiss:3000 quadriphones

71

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Portage de la Darija

Cration du synthtiseur par SU


Optimisation du Script :
Ajout de 60626 (6 heures d'enregistrement)
Utilisation des phrases de 5 logatomes de deux quadriphones

72

Introduction | SOFT CENTRE | Synthse Vocale | MaryTTS | Portage de la Darija | Dmonstration | conclusion

Test

wHed ssalmu 3likm




kijkm lkstm dyl

?na kneqra felmsTer

73

Co nclusion et perspectives
Ce serait certes une invention considrable, que celle dune
machine capable de reproduire nos paroles, avec leurs sons et
leurs articulations. Je crois que la chose nest pas impossible.
Euler, 1761

74

Your Footer Here

Your Date Here

Das könnte Ihnen auch gefallen