Beruflich Dokumente
Kultur Dokumente
Philippe Gourgand
[2010]
Tuteur en entreprise : M. Perrin Enseignant Suiveur : M. Odin Enseignant Lecteur: Mme. Bureau
Remerciements
La rdaction de ce mmoire ma permis de rencontrer des gens nouveaux, qui mont apport beaucoup daide et de soutien dans mes recherches et que je souhaite aujourdhui remercier. Tout dabord, je tiens remercier Vronique Cohen et lquipe pdagogique de lIUT qui mont donn envie dapprofondir les comptences ncessaires pour conduire un projet dans le secteur du multimdia dans une entreprise, au point de mamener aujourdhui rdiger un mmoire traitant de ce sujet. Au cours de cette anne, une autre personne a fortement influenc mes choix quant lorientation de mon mmoire et lintrt que je porte tout ce qui touche aux aspects technologiques du secteur du multimdia. Je souhaite donc ici saluer Alain Rosset PDG dUbicMedia SAS qui ma fait confiance en signant ce contrat dapprentissage avec moi et qui mencourage encore aprs cette anne passe ensemble dans cette direction. Je tiens galement adresser des remerciements sincres Bertrand Perrin, directeur technique et maitre dapprentissage qui ma apport une aide prcieuse dans la rdaction de ce mmoire. Je tiens remercier aussi Lionel Martin qui ma apport un regard clair (et toutes les documentations techniques lire en anglais). Enfin, je remercie tous ceux qui mont apport leur soutien et leur aide au cours de cette anne, ma famille et plus spcialement mon pre, qui a su me soutenir dans mes priodes de doute et sans qui lachvement de ce travail aurait t beaucoup plus difficile, sans oublier ma mre pour son grand sens de lorthographe...
Mon entreprise
1.3 Notions de structure dun fichier Vido .................................................................................................... 9 1.4 Notion de dbit de donnes (Bitrate) ..................................................................................................... 11 2 - Etude Avance du Format vido AVC/H.264................................................................................................ 12 2.1 Prsentation Technologique ................................................................................................................... 12 2.1.1 Technologie ...................................................................................................................................... 12 2.1.2 Apports et Etude Comparative ......................................................................................................... 21 2.1.3 : Technologies Evolutives de ce format ............................................................................................ 27 3- Solutions Alternatives : Formats Propritaires et Open-source .................................................................. 33 3.1 VC-1 (Format Propritaire) ................................................................................................................... 33 3.2 X.264 (CODEC Alternatif) ...................................................................................................................... 35 Un Contexte conomique et technologique: ................................................................................................ 37 3.3 Ogg Theora (format open-source) ........................................................................................................ 37 Voici un comparatif visuel du mme fichier encod en H.264 et en Theora ............................................ 38 3.4 WebM (VP-8) (Format open-source) .................................................................................................... 42 Voici un petit comparatif visuel entre le VP8 et lAVC/H.264 ................................................................... 43 Conclusion et Prospective: ................................................................................................................................ 44 Annexes : ........................................................................................................................................................... 47 Lexique :......................................................................................................................................................... 47 Bibliographie :................................................................................................................................................ 50 Notes : ........................................................................................................................................................... 51
Introduction :
Chaque jour, lorsque vous allumez votre tlviseur, votre ordinateur, votre tlphone portable, vous visionnez des clips vido, des extraits de films, des missions de tlvision, avec votre Smartphone, votre camscope, vous saisissez en vido des scnes entre amis. Chacune de ces vidos est numrique et diffuse comme tel par lInternet, les chaines de tlvision TNT, les oprateurs tlphoniques, les sites de diffusion comme YouTube ou DailyMotion et autres supports DVD ou cls USB. Pour lutilisateur final que nous sommes, ces images sont seulement diffrencies par le format (hauteur par largeur) et lcran de diffusion (petit ou grand) : la notion de format importe peu lutilisateur puisque la technologie est l pour afficher presque nimporte quelle image sur nimporte quel cran. Pourtant, lutilisateur lambda est familiaris avec les formats du cinma : Super8mm, 16mm, 35mm, cinmascope, Panavision, et les formats de la tlvision : SECAM en France, PAL en Allemagne, NTSC aux Etats Unis. Chacun de ces formats voque des notions de qualit dimage (familiale pour le super8 ou professionnelle pour le cinmascope), des spcificits gographiques et donc difficilement compatibles entre les pays : une cassette VHS achete aux USA ne pouvait tre lue sur un magntoscope franais. Dans le monde du numrique daujourdhui, il en va de mme. De multiples formats sont apparus pour fabriquer des photos et des vidos, lutilisateur se perd entre les formats de prise de vues, de retouche, de diffusion ou de stockage, et leurs incompatibilits. Pourtant, une homognisation des technologies du numrique est en train de voir le jour : Quel est le point commun entre les vidos diffuses par le clbre site YOUTUBE, le flash incontournable sur Internet, la TNT haute dfinition et le Blu-ray ? Le format vido Advanced Video Coding/H.264 (AVC/H.264 ou h.264). Au gr de mes premires expriences professionnelles, jai utilis diverses technologies dans le domaine de la vido et de lInternet, et dernirement, au cours de la mission que ma confie mon maitre dapprentissage, jai t amen tudier ce format dans toutes ces composantes. Ltude mene depuis un an ma permis dapprhender cette technologie dans sa globalit, grce tous les usages que jai pu observer et raliser. Au travers de ce mmoire, je vais vous montrer que le format vido Advanced Video Coding/H.264 (AVC/H.264 ou h.264) devient le format universel de captation, de production et de diffusion, et sadapte tous les usages prsents et futurs. Ce format est-il rellement la solution aux attentes des utilisateurs (particuliers et professionnels), en terme de demandes de Qualit Audiovisuelle et dAccessibilit Universelle ? Pour rpondre cette problmatique, nous devrons comprendre cette technologie, la resituer dans lensemble des formats vido numriques et ainsi pouvoir en mesurer limpact sur le futur.
Historique :
En janvier 1988, le Motion Picture Expert Group (MPEG) runit les experts de lOrganisation Internationale de Normalisation et la Commission Electrotechnique Internationale (ISO/CEI) pour dfinir un systme normalis de codage de contenus cinmatographiques, le MPEG-1. Le MPEG-1 est ainsi la premire norme prsente pour les applications multimdia. Elle sera ensuite complte par la norme MPEG-2 pour les applications du domaine de la radiodiffusion. La norme MPEG-2 est structure en profils et niveaux et, pour chacun d'eux, le dbit binaire maximum que le dcodeur doit pouvoir traiter est clairement dfini. Une fois normalise, MPEG-2 a t trs largement utilise (DVB Norme TV europenne, ATSC Norme TV USA, DVD, etc.). A l'instar de la plupart des autres mthodes de codage, MPEG-2 dfinit uniquement la syntaxe du flux binaire et les caractristiques du dcodeur, laissant aux fabricants le loisir d'appliquer l'algorithme ct codeur. Pour ces raisons, les codeurs MPEG-2 affichent des performances diffrentes selon le type d'algorithme affect la compensation de mouvement, les valeurs de la matrice de quantification et le dispositif de contrle du dbit. En 1999, apparait le premier successeur de la norme MPEG-2, le MPEG-4, partie 2 publie par l'ISO. Comme dans le cas de MPEG-2, l'efficacit du codage est troitement lie la complexit du matriel de source et la mise en uvre du codeur. MPEG-4 a t dfinie pour des applications multimdia faibles dbits binaires, puis tendue aux applications du domaine de la radiodiffusion. Une valuation officielle subjective indique que le codage MPEG-4, partie 2, offre un gain d'efficacit de 200 400 % par rapport MPEG-2. Ainsi, pour les applications DVB (tlvision numrique europenne), ce gain n'est pas suffisant pour justifier une migration du MPEG-2 vers le MPEG-4, partie 2. En 2001, soucieuses de mettre au point un systme de compression plus efficace, les instances de normalisation ISO/CIE (MPEG) et lUnion internationale des Tlcommunications (UIT) conjuguent leurs efforts au sein du groupe de travail Joint Video Team (JVT) charg de dvelopper le systme de codage Advanced Video Coding ou AVC. En 2003, le systme AVC est intgr en tant que partie 10, la norme MPEG-4 (ISO/ IEC 14496-10) et repris sous lappellation H.264 (H.264/AVC (MPEG-4, Part 10)). En septembre 2004, le consortium DVB modifie la norme TS 101 1542 (Implmentation Guidelines for the Use of Vido and Audio Coding in Broadcasting Applications based on the MPEG-2 Transport Stream) afin d'y inclure galement AVC/H.264.
La fonction Codage (Compression): La fonction de codage (ou dencodage) est la compression de donnes, ou codage, qui consiste transformer une suite de bits A en une suite de bits B plus courte, contenant les mmes informations, en utilisant un algorithme particulier. Cette opration de codage, consiste changer la reprsentation de l'information, dans le but de rendre la reprsentation compresse plus courte que la reprsentation originale. La dcompression est l'opration inverse de la compression.
La fonction Dcodage (Dcompression): La fonction de dcodage, ou dcompression, est la lecture du fichier numrique audio/vido. Pour quune vido soit lisible sur un ordinateur ou tout autre lecteur multimdia, il faut donc que le CODEC appropri y soit install (et dans le cas dun CODEC matriel, que soit prsente une carte de dcompression). On dit quun CODEC est performant en lecture si limage quil affiche est nette, sans saccade et ne consomme pas abusivement la puissance du processeur. La lecture du fichier numrique audio/vido se fait grce un logiciel intgrant le CODEC appropri. Ces applications de lecture sont des logiciels de lecture simple et des logiciels d'dition : logiciel de montage vido, audio, logiciel d'animation, logiciel deffets, logiciel 3D. Certains sont de vrais gestionnaires de donnes multimdia permettant d'acheter des fichiers en ligne et de grer les DRM. D'autres sont capables grce un moteur de recherche local de cataloguer et organiser ces donnes, ils offrent aussi des fonctions plus avances comme des rglages de colorimtrie. Ces logiciels utilisent des players pour visualiser le contenu multimdia et permettent la lecture de Au travers de cette tude, nous allons mtadonnes. observer des tests excuts avec La plupart des formats audio/vido numrique se reconnaissent diffrents logiciels de transcodage. par la forme de leur enveloppe de transport (on dit que les Cela ayant pour but de confronter formats sont encapsuls), comme le MPG, lAVI de Microsoft leurs performances, (Audio Video Interleave) ou le Quicktime (.MOV) dApple. Mais aussi bien lors de transcodages que ces enveloppes ne permettent pas didentifier le CODEC utilis. lors de dcodages. On constate, linstar de Google, que Microsoft et Apple dveloppent en interne leurs propres CODEC et les implantent dans leurs systmes dexploitation. Philippe Gourgand Licence CPTIC - 2010
6
La fonction Transcodage (changement de CODEC) : Le transcodage, en vido et/ou en audio, est le fait de changer le format de codage dun mdia en le comprimant ou lencapsulant. Le transcodage permet d'adapter le format du mdia au support sur lequel il est transport, stock ou diffus. Il est aussi utilis pour adapter le mdia aux matriels, aux normes diffrentes en vue de son traitement (interoprabilit). On notera qu'il ne s'agit pas d'un codage au sens strict du terme car le plus souvent la transformation comporte des pertes. Ainsi, le format SVCD par exemple, permet de faire contenir un film de plus d'une heure sur un support de 650 Mo (CD), au prix d'une qualit d'image moins bonne qu'un DVD (4,7Go) en raison du codec utilis pour parvenir cela : on parle alors dun codec destructif. On adaptera donc, soit la qualit du mdia une quantit de donnes d'information (rsolution, finesse des dtails) compatible avec le support envisag au transport, au stockage ou la diffusion du mdia, soit sa quantit d'information vhicule en modifiant par exemple le nombre d'images par seconde d'une vido, ou en changeant sa dfinition.
Il ne faut pas confondre format et conteneur ! Un conteneur .AVI peut contenir diffrents formats de fichiers
Chaque fichier vido possde un PROFIL, celui-ci correspond des caractristiques le destinant des applications diffrentes. Chaque profil a son utilisation finale. Ce profil est dfini lors du processus de transcodage par le logiciel, il est possible dinfluer manuellement sur ces rglages mais cela reste rserv aux utilisateurs expriments.
Chaque fichier vido possde aussi un NIVEAU (Level), qui lui est propre. Ce niveau, est une valeur comprise entre 1 (le plus bas) 5.1 (le plus lev) correspond des limitations sur un certain nombre de paramtres. Cela indique au logiciel de dcompression les ressources machine ncessaires pour dcompresser la vido. Plus son profil est lev, et plus sa dcompression va requrir de ressources.
Ces deux notions seront dtailles plus tard, dans la 2me partie de ce mmoire.
10
Il convient de diffrencier 2 types de Bitrate en vido : Le Dbit Constant (CBR) Le dbit du fichier est fix une valeur donne pour toute la dure de la vido et/ou de laudio. Lors du processus dencodage, on attribue une valeur de Bitrate, celle-ci correspond la qualit que lon veut donner au fichier encod. En fonction de la dfinition de la vido, cest--dire sa taille, celle-ci est exprime en pixel, comme la taille dun cran dordinateur. Plus la dfinition est importante, plus le Bitrate doit tre important, linverse si celle-ci est rduite, le dbit peut tre diminu.
Le Dbit Variable (VBR) Le dbit fix nest quune moyenne. Lors de squences ne ncessitant que peu dinformations la valeur va tre rduite automatiquement en fonction de la charge ncessaire, linverse pour les squences complexes, le dbit est augment. Ce type de dbit a lavantage certain de rendre un fichier de qualit suprieure. Puisque celui-ci va sadapter automatiquement la complexit de la vido. De plus, les fichiers encods ont un poids sensiblement infrieur ceux encods avec un dbit de type constant. Lamplitude, lcart entre le dbut minimum et le dbit maximum varie selon les choix de lutilisateur ou des paramtres prdfinis du logiciel. Cet cart peut tre extrme sans pour autant augmenter significativement le poids du fichier.
Exemple : une vido Haute Dfinition aura un Bitrate de 6Mb/s (voir 15Mb/s pour un film commercial) alors quune vido pour lInternet dans une dfinition plus standard pourra avoir une qualit correcte avec un dbit de 1Mb/S voire 1,5Mb/s si la vido est complexe.
11
12
Un codage adaptatif de type Huffman longueur variable (CAVLC : Context-Adaptive Huffman Variable-Length Coding) La numrotation des images permet la cration de sous-squences (ceci permet une Scalabilit temporelle que nous tudierons plus tard dans ce mmoire)
Ces technologies, ainsi que plusieurs autres permettent au format AVC/H.264 de dpasser les standards prcdents en termes de qualit dans une grande varit de circonstances et dans une grande varit d'environnements d'application. Cela apporte un nouveau standard en termes de qualit de diffusion. On remarque que le format AVC/H.264 produit des fichiers dont le poids est infrieur une vido MPEG-2, en obtenant la mme qualit avec un Bitrate diminu de moiti, voire plus. Comparons 2 formats utiliss en utilisation commerciale ; Prenons un DVD par exemple, celui-ci contient plusieurs fichiers Vido encods en MPEG-2 en 720x576 pixels (576p) La particularit du DVD est de concatner la totalit du film en plusieurs fichiers de 1 Go, et ces fichiers sont dnomms en .VOB. Cela explique pourquoi lorsque lon visionne un DVD, il peut y avoir une lgre coupure de limage pendant un bref instant. Cela est d au changement de VOB pendant la lecture. Le DVD existant depuis 1995, et les ordinateurs tant limits lpoque, il a fallu trouver une astuce pour rduire la charge du processeur lors de la dcompression des films. Depuis, le processeur ne dcompresse plus le MPEG-2, la carte graphique soccupe de cette tche. Un VOB correspond environ 30 minutes de vido, cela est approximatif car dpendant de la qualit vise par le studio responsable de la production du DVD. De plus, la dure maximale va dpendre de la technologie de compression utilise (Compression dbit constant ou variable) Ce principe est applicable tous les formats de vido et tous leurs supports. Donc en MPEG-2 ,576p : 1Go 30minutes (MPEG-2 : entre 1 Mbit/s et 15 Mbit/s en dfinition standard (SD : 720 x 576 pixels en PAL))
Sur un Blu-ray o le format AVC/H.264 est utilis, il ny a quun seul fichier pour la globalit du film. Cela ne produit pas de coupure pendant la lecture, mais ncessite un PC relativement puissant ou un matriel de dcompression ddi (lecteur Blu-ray de salon, carte de dcompression HD), aussi du fait de sa plus grande compression, donc complexit. Par contre, en AVC/H.264 576p 3Mb/s est recommand AVCHD : entre 5 et 24 Mbit/s en 720p et 1080p Un film H.264 qualit Blu-ray en 1080p peut peser jusqu 35Go ! Il est difficile pour ce format de donner une valeur de rfrence pour 30minutes, cela varie en fonction du matriel de captation ou du logiciel utilis. Toutefois, il faut nuancer ces valeurs, car le H.264 utilise la plupart du temps un encodage de type Variable. Les chiffres donns ne sont que des moyennes permettant dafficher une marge suffisante pour permettre aux CODEC de travailler sur le flux vido de manire optimale. Les images ne ncessitant pas du dbit maximum seront bien sr encodes un dbit moindre, permettant ainsi davoir un fichier HD avec un poids infrieur au 5,2Go ncessaire un fichier d1h en 6Mb/s
13
Concrtement, lors dun encodage dune vido dun format vers celui-ci, le CODEC va analyser la vido source. Lors de cette opration le logiciel va analyser image par image les lments (objets) apparents ainsi que leurs trajectoires, mais aussi les couleurs des images ainsi que laspect de limage sil sagit dun film en 16/9 ou 4/3, ou encore au format cinma anamorphos (cinmascope, Panavision,)
Ensuite, lopration de transcodage dbute, le CODEC va, en fonction de lanalyse, compresser ces images laide de MacroBloc ceux-ci sont des blocs de Pixel de diffrentes tailles, Ceux-ci tant gnralement dsigns ainsi : (1616, 168, 816, 88, 84, 48, 44) Plus leur taille sera petite, plus leur prcision sera proche de loriginale. La taille de ces blocs est dfinie lavance par lanalyse de leurs emplacements sur limage. En effet, une zone contenant du mouvement sera dfinie par des MacroBloc de plus petite taille pouvant ainsi reproduire ce mouvement de manire plus prcise. Par diffrence, une zone ayant peu, ou pas du tout de mouvement sera dfinie par des MacroBloc plus gros donc moins prcis.
Une fois cette opration de transcodage termine le logiciel va recoller les flux Vido et Audio dans le fichier conteneur, on dit quil effectue un multiplexage. Lors du transcodage, le logiciel a, nous lavons dit, rencod la vido, et fait de mme avec la ou les diffrentes pistes son. Car un format comme lAVC/H.264 peut, au sein du conteneur supporter diffrents format audio. Exemple : un Blu-ray contient au minimum 2 pistes, la VO et la VF.
14
Comme nous lavons vu prcdemment, un transcodage peut induire une perte de donnes, mais certains formats audio dit lossless (sans perte) permettent de bnficier dun son de grande qualit. Une fois multiplex, le fichier peut tre lu condition de possder un logiciel pouvant dcompresser la vido ou tout autre appareil comme un tlphone compatible ou un lecteur de salon. A noter, quil existe aussi des formats vido sans perte, dont principalement le Motion JPEG 2000, qui sera utilis plus loin dans ce mmoire.
La contrepartie, est que le format AVC/H.264 peut, dans certaines conditions ncessitant une qualit maximale, tre assez complexe dcompresser et donc visualiser. Ceci interdit la lecture de film sur des ordinateurs peu puissants comme les Netbook. La notion de complexit, veut dire que pour dcoder le ou les flux, le traitement ncessitera de la part du processeur un apport de puissance bien suprieur. Toutefois, il existe une parade : les Cartes Graphiques ou GPU (Graphic Processor Unit). Celles-ci deviennent suffisamment puissantes pour dcoder en partie ou totalement les flux vidos. Cela permet de laisser le processeur libre pour dautres oprations. On appelle cela le DXVA (DirectX Video Acceleration) Certains Codec (propritaires) AVC/H.264 ont comme avantage dtre pleinement compatibles avec cette technologie. Certains Netbook plus avancs possdent un GPU plus puissant, pouvant dcompresser des flux HD. Mais cela est souvent un argument marketing. Toutefois, pour une utilisation Internet, les fichiers sont taills pour le streaming, donc de qualit visuelle infrieure. Le problme de complexit ne sapplique pas. La problmatique principale devient alors la Bande Passante Il devient ncessaire davoir accs une connexion Internet haut dbit pour bnficier de laffichage de film en streaming. (Nous parlons ici de streaming, nous naborderons pas lpineux problme du streaming illgal.) Le streaming a lavantage de diffuser des fichiers de qualit infrieure, leur poids est plus faible donc plus facile transporter, tlcharger. Un avantage certain pour les personnes qui ne veulent pas tlcharger un fichier complet DVD ou HD. Lordinateur a toujours le rle de la dcompression, mais la complexit tant moindre, son travail est facilit. Il est possible lheure actuelle de visionner certaines vidos encodes dans ce format laide dun Smartphone, par exemple. Toutefois, vous tes tributaire de la technologie Flash de lditeur Adobe, car celle-ci a pour rle dacheminer le flux vido jusqu votre ordinateur.
15
2.1.1.1 Profils On appelle Profils un ensemble doutils, principalement des algorithmes et des process lis au codage et au dcodage de vido. Ces outils sont autant dimplmentations quil existe de technologies doptimisation dans le h.264, chaque profil est dfini en fonction des technologies supportes ou non. Un logiciel dencodage, a la capacit dtre flexible sur ce point, puisquil va en fonction des rglages dfinis par lutilisateur, slectionner le bon profil, permettant ainsi au dcodeur dadapter son processus de dcodage par rapport au mode de codage pralablement dfini. Il est donc dfini lors du processus de transcodage par le logiciel, toutefois il est possible dinfluer manuellement sur ces rglages mais cela reste rserv aux utilisateurs expriments. Cest aussi un moyen de normer les diffrents fichiers, ceci permettant davoir une uniformisation des fichiers malgr leurs nombreux profils. Tout fichier possdera un Profil, le plus gnralement le profil Main le plus standard Le profil Baseline et extended sont utiliss pour le streaming Le Profil High est utilis pour les fichiers HD et ncessitant une haute qualit. Le Profil Intra est utilis pour les fichiers produits par les camras de type professionnel, il permet ldition des fichiers HD ou SD dans les logiciels de montage vido professionnel.
(Schma des 3 Profils les plus utiliss et les plus courants) Ce schma prsente les principales diffrences entre les profils, prsentant leurs technologies et possibilits
16
Certains Profils ont plusieurs dclinaisons particulirement le High et le Intra Les diffrences sont souvent minimes mais apportent une ou deux amliorations et optimisations, qui seront bienvenues pour un usage professionnel et commercial.
(Schma des profils utiliss par la plupart des logiciels dencodage professionnels et amateur) Ce schma apporte un complment dinformation quant la diffrenciation des sous profils Main et High
17
(Schma des Profils utiliss par les studios de Production pour le montage (Intra) et pour une utilisation commerciale (High)) Ce schma prsente les diffrenciations entre le profil Main et les profils Intra utilis en Production !
18
2.1.1.2 Levels (Niveaux) Nous lavons dj abord dans les notions, mais le niveau dun fichier est un lment trs important prendre en compte. Cette Valeur, est dtermine lors de lencodage du fichier vido, et est en rapport avec les diffrents lments qui composent le fichier, plus particulirement son flux vido : sa rsolution, son dbit (Bitrate) et surtout son profil. Cette valeur va de 1 5.1 voire dans certains cas, une valeur plus importante allant jusqu 5.4. Celle-ci se trouve dans de rares logiciels spcialiss permettant ldition de Master 2 K ou 4 K pour le Cinma et ldition de DVD et Blu-ray. Elle indique au logiciel de dcompression les ressources machine ncessaires pour dcompresser la vido. Plus son profil est lev, et plus sa dcompression va requrir de ressources.
(Schma prsentant des exemples de profils et niveaux en fonction de la rsolution de limage) Un profil de niveau 1 par exemple ne pourra sappliquer qu une vido de 12896 pixels a 30images/s Alors quun niveau 3 ne sapplique que pour les vidos de 720576 pixels 25images/s (Qualit DVD) Vous laurez compris pour de la Haute dfinition, un Blu-ray par exemple doit avoir un niveau plus lev ; un niveau 4 est ncessaire, car cest partir de ce niveau quun fichier est capable de possder une rsolution aussi importante.
19
Max macroblocks Level per second 1 1b 1.1 1.2 1.3 2 2.1 1,485 1,485 3 6 11,88 11,88 19,8 per frame 99 99 396 396 396 396 792 BP, XP, MP (kbit/s) 64 128 192 384 768 2 4
Max video bit rate (VCL) HiP (kbit/s) 80 160 240 480 960 2,5 5 Hi10P (kbit/s) 192 384 576 1,152 2,304 6 12 Hi422P, Hi444PP (kbit/s) 256 512 768 1,536 3,072 8 16
Examples for high resolution @ frame rate (max stored frames) 12896@30.9 (8) 176144@15.0 (4) 12896@30.9 (8) 176144@15.0 (4) 176144@30.3 (9) 320240@10.0 (3) 352288@7.5 (2) 320240@20.0 (7) 352288@15.2 (6) 320240@36.0 (7) 352288@30.0 (6) 320240@36.0 (7) 352288@30.0 (6) 352480@30.0 (7) 352576@25.0 (6) 352480@30.7(10) 352576@25.6 (7) 720480@15.0 (6) 720576@12.5 (5) 352480@61.4 (12) 352576@51.1 (10) 720480@30.0 (6) 720576@25.0 (5) 720480@80.0 (13) 720576@66.7 (11) 1280720@30.0 (5) 1,280720@60.0 (5) 1,2801,024@42.2 (4) 1,280720@68.3 (9) 1,9201,080@30.1 (4) 2,0481,024@30.0 (4) 1,280720@68.3 (9) 1,9201,080@30.1 (4) 2,0481,024@30.0 (4) 1,9201,080@64.0 (4) 2,0481,080@60.0 (4) 1,9201,080@72.3 (13) 2,0481,024@72.0 (13) 2,0481,080@67.8 (12) 2,5601,920@30.7 (5) 3,6801,536@26.7 (5) 1,9201,080@120.5 (16) 4,0962,048@30.0 (5) 4,0962,304@26.7 (5)
2.2
20,25
1,62
12
16
40,5
1,62
10
12,5
30
40
3.1 3.2 4
14 20 20
17,5 25 25
42 60 60
56 80 80
4.1 4.2
245,76 522,24
8,192 8,704
50 50
62,5 62,5
150 150
200 200
589,824
22,08
135
168,75
405
540
5.1
983,04
36,864
240
300
720
960
20
2.1.2 Apports et Etude Comparative Tout dabord, ce format apporte un gain de place indniable ; un film encod en AVC/H.264 pse beaucoup moins de Megaoctet sur un Disque Dur, en opposition au mme film encod dans un format brut de production ou un autre format comme le MPEG-2 voire mme son prdcesseur le MPEG-4, encore trs utilis aujourdhui. En termes de technique pure, ce format apporte un plus grand respect des chrominances de limage, une meilleure prcision et compensation du mouvement. Cest principalement pour cela que lindustrie du cinma a choisi ce format pour les films Blu-ray ; ce gain de place permet de mettre sur un seul disque le film en Haute dfinition, les pistes sons, et diffrents bonus. La meilleure manire pour moi de vous dmontrer les apports de ce format, est de vous prsenter un comparatif visuel sur une vido en Haute Dfinition, ici le Full HD 1080p. Nous allons comparer le rendu dun film (un court extrait) selon diffrents critres : - Qualit visuelle psychologique - Pixellisation - Poids du fichier - Charge du processeur lors de la dcompression Nous allons slectionner un extrait de film, ou plutt une bande annonce dans laquelle, nous aurons des squences ayant des mouvements rapides mais aussi peu de mouvement. Pour que ce comparatif soit reprsentatif, toutes les vidos seront encodes sur le mme ordinateur. (Les temps de travail pouvant varier en fonction de la configuration matriel, dun ordinateur un autre.) La bande annonce retenue est celle du film Scott Pilgrim VS the world Lavantage de cet extrait, est quil est assez court (environ 2minutes), quil est compos la fois de scnes daction trs colores avec beaucoup de mouvements ainsi que des passages dtaills plus lents. Les images utilises, reprsentent les acteurs Michael Cera, Satya Bhabha et Mary Elizabeth Winstead. Cette Bande annonce a t rcupre sur un site internet, www.HD-trailers.com. Elle est au format Full HD soit 1920x1080. Lavantage dutiliser une vido de cette qualit permet davoir beaucoup plus de pixels que sur une Vido qualit DVD en 576p (720x576). Lors dun comparatif de qualit, cela permet de voir beaucoup plus facilement lil nu, les dfauts et artefacts visuels. Sa qualit visuelle est la mme quune version commerciale Blu-ray. Avant deffectuer ces tests, nous allons changer le format de cette vido, par un format brut, non compress. Le choix a t port sur le standard de projection du cinma numrique, le Motion JPEG 2000. Il sagit dun format de vido, utilisant le format JPEG, que tout le monde connait, car toutes les images sont dans ce format. Le MJPEG 2000, encode une vido en 25 ou 24, 97 images JPEG par seconde. Cela a pour avantage de ne perdre aucune information, de crer un fichier totalement parfait qualitativement, mais extrmement lourd (700Mo pour environ 2Minutes de films en HD)
21
Procdure de test :
Le fichier ainsi cr est import dans diffrents logiciels dencodage du march. Pour tre reprsentatif, nous allons utiliser des logiciels propritaires payants et dautres libres et gratuits. Jai gard les rglages par dfaut de ces logiciels. Nous pourrions utiliser des milliers de rglages pour affiner les fichiers finaux. Mais en utilisant les rglages de base, nous utilisons les paramtres utiliss par monsieur tout le monde.
Image de rfrence :
Au format JPEG 2000 1920x1080pixels
22
Transcodage H.264 :
8 Min de traitement Poids 26,6Mo Dbit 1,29Mb/s Variable Utilisation CPU : 13%
23
Transcodage MPEG 2 HD : 4 Min de traitement Poids 118,7Mo Dbit 6Mb/s Constant Utilisation CPU : 8%
Transcodage VC-1 :
5 Min de traitement Poids 113,4Mo Dbit 6Mb/s Variable Utilisation CPU : 15%
Transcodage H.264 :
7 Min de traitement Poids 111Mo Dbit 6mb/s Constant Utilisation CPU : 10%
24
Transcodage MPEG-2 HD :
Transcodage WMV :
25 Min de traitement Poids 151,5Mo Dbit 8Mo Variable Utilisation CPU : 10%
25
Logiciel : MediaCoder
Transcodage x.264 :
6 Min de traitement Poids 22,8Mo Dbit 1,1 Mb/s Variable Utilisation CPU : 13%
On remarque tout de suite les disparits de poids, de temps de calcul et dutilisation du processeur de la machine. Ceci est principalement caus par la finalit du logiciel (Professionnel ou Grand public). Si le logiciel est de type professionnel son temps de traitement va souvent tre plus long, car les algorithmes de compression qui le composent sont plus mthodiques . Dans le cas de notre tude ci-dessus, le logiciel Adobe Media Encoder, est un logiciel Professionnel (il fait partie dun Workflow complet Adobe Production). En fonction de la complexit de la vido cela va entrainer un temps et un effort de calcul plus soutenus. De plus, le logiciel va normer le fichier final, cest--dire quil cre un fichier de type Broadcast prt tre diffus, en tant sr que le fichier soit respectueux de la norme, mais aussi de sa structure interne, ne causant ainsi pas dincompatibilits. Un logiciel nayant pas pour vocation dtre Broadcast aura une vocation plus grand public : transcodage de film de vacances, ou de fichiers destination dun baladeur par exemple, ou simplement publication sur Internet. La liste de ce type de logiciel est longue ; AVS vido Converter, MainConcept Reference, SUPER, Xilisoft vido coder, MediaCoder Ceux-ci ont un temps de traitement plus court, en moyenne, car les fichiers traits ont comme finalit dtre publis ou utiliss par lutilisateur dans un cadre familial. En effet ce dernier installe un de ces programmes souvent gratuit ou un cot drisoire, et importe dans celui-ci une liste de fichiers quil veut transcoder. Ce logiciel nayant pas pour vocation de faire de la qualit Broadcast les fichiers finaux ne sont que trop rarement norms , impliquant ainsi le plus souvent des incompatibilits avec certains autres logiciels de visionnage ou plateforme de publication en ligne. On peut aussi remarquer que la consommation de ressources processeur durant la lecture varie en fonction du logiciel utilis pour crer le fichier H.264. La consommation est dpendante de lalgorithme utilis pour le transcodage du fichier, mais aussi de divers paramtres comme son profil et son niveau, comme nous avons pu le voir prcdemment. Vous pouvez aussi noter les diffrences de rendu chromatique entre les diffrents formats !
26
2.1.3 : Technologies Evolutives de ce format 2.1.3.1 : Scalable Video Coding (SVC) Il sagit du nom donn une extension du format H.264 dveloppe conjointement par UIT-T et l'ISO. Les deux groupes ont cr le Joint Video Team (JVT) pour dvelopper la norme H.264, ou MPEG-4 AVC (ITU-T Rec. H.264 | ISO/IEC 14496-10 AVC). En octobre 2003, le groupe Moving Picture Experts Group (MPEG) lance un appel la communaut scientifique ( Call for Proposals on SVC Technology ). Quatorze projets, dont douze bass sur la compression par ondelettes, sont proposs. Les deux propositions restantes tant des extensions de H.264/MPEG-4 AVC. L'une d'elle, propose par l'quipe image du Heinrich-Hertz-Institut (HHI) est choisie par MPEG comme point de dpart de son projet de standardisation de SVC. En janvier 2005, les groupes MPEG et Video Coding Experts Group (VCEG) se sont entendus pour finaliser le projet SVC comme un amendement de leur standard H.264/MPEG-4 AVC. L'objectif de SVC est d'offrir un contenu chelonnable, dit Scalable, c'est--dire que le contenu peut tre encod une fois, et offrir ensuite diffrents paliers de qualit en utilisant diffrents dbits. En Novembre 2008, Google a lanc son nouveau service "Gmail Video chat" qui utilise un codec H.264/SVC. C'est probablement le premier service utiliser cette norme pour des applications "grand public". Le CODEC SVC ncessite lutilisation de plusieurs couches Layers , chaque couche va tre encode diffrents dbits, celles-ci sont runies dans un seul et mme fichier. Lors du dcodage, le lecteur va en fonction de plusieurs paramtres dterminants, slectionner la ou les couches pouvant tre lues et surtout slectionner en priorit celle qui possde le plus fort ratio Qualit/Poids, pour permettre lutilisateur davoir la meilleure exprience possible. Ces diffrents paramtres sont : - La vitesse de Connexion internet pour une lecture en Streaming. - La puissance de dcodage de la machine ou de lappareil mobile qui effectue la dcompression. - La rsolution maximale de lcran. Le logiciel charg de la dcompression va automatiquement adapter le dcodage en fonction de ces paramtres, et peut mme le faire la vole. Exemple, vous visionnez un film en streaming, et au mme moment un membre de la famille commence le tlchargement dun fichier de grande taille. Automatiquement la qualit de la vido va diminuer, pour adapter son Bitrate en fonction de la bande passante disponible sur votre ligne.
27
Autre exemple, vous tlchargez un film encod en SVC et le donnez un ami, celui-ci na srement pas le mme matriel que vous (ordinateur, tlvision, lecteur). Or pendant la lecture le logiciel va adapter le fichier son cran plus grand que le vtre par exemple en utilisant le layer FullHD 1080p alors que vous utilisiez le layer 720p. Ceci peut tre applicable toutes les situations, le fichier ne peut plus tre pris en dfaut. Plus de cas o votre PC nest pas assez puissant pour dcompresser un flux. Hypothtiquement, le fichier peut tre lu depuis un tlphone mobile avec son petit cran ou depuis un Home Cinma FullHD 1080p voire plus ! Cela dpend du nombre de couches de Scalabilit utilises. Mais la question du poids du fichier ? On pourrait penser que de cumuler des couches implique le cumul du poids de toutes celles-ci. Or ce nest pas le cas. Grace des algorithmes, certaines zones de limage affiche sont partages toutes les couches. Mais certes le poids du fichier est bien sr suprieur un fichier simple , il est estim thoriquement a un surpoids de 40% au minimum. Il y a 3 grands Principes de Scalabilit : - Scalabilit temporelle : Chaque vido possde un nombre dimage par seconde diffrent, 24 au cinma, 25 la tlvision franaise, 29,97 aux Etats Unis Le concept de Scalabilit temporelle permet pour une mme vido de changer ce paramtre sans dtriorer le rendu visuel final de la vido. Cependant celle-ci pourra se retrouver acclre, comme passer de 24 images par seconde pour un film en salle et 25 images pour sa version DVD. Et croyez-moi, il y aura une diffrence au niveau du son, souvent plus aigu ! Scalabilit Spatiale : Ce concept permet de changer la taille, la rsolution dune vido. Lorsque vous agrandissez une vido dans un lecteur, vous ne faites que grossir les pixels de cette vido. On appelle ceci une interpolation de pixel , la preuve en est que si vous possdez une tlvision HD, et que vous visionnez un film DVD, vous verrez apparaitre des artefacts visuels. Les pixels ont t grossis ainsi que les dfauts. Or la Scalabilit permet grce certains algorithmes dencodage de passer dune rsolution moyenne une rsolution plus grande sans avoir une pareille dtrioration. Scalabilit Qualitative : Cela consiste rajouter des couches de dtails lors de lencodage du fichier, celle-ci ne seront lues que si cela est ncessaire, en augmentant le Bitrate de la bande passante dans le cas dun fichier lu en streaming. Microsoft a implment cette technologie au sein de sa technologie de diffusion Internet Silverlight . Dmonstration accessible cette adresse : http://www.iis.net/media/experiencesmoothstreaming Mais aussi en fonction de la rsolution de votre cran !
28
(Schma proprit de linstitut Fraunhofer, montrant visuellement les 3 types de Scalabilit) Ce schma montre de faon concrte, les 3 types de Scalabilit existantes. La modification de la cadence dimage, laugmentation ou la rduction de la rsolution dune vido, ainsi que laugmentation ou la baisse de qualit la vole.
(Schma reprsentant le cas o lon voulait crer diffrents fichiers pour diffrents types de bandes passantes) En temps normal il est recommand dencoder un fichier pour un usage spcifique, une version DVD et une version HD, ce que font par exemple les services de Video la demande (VOD) comme il en existe des dizaines en France. Il est de plus en plus possible de trouver des services proposant diffrentes versions de fichiers pour des supports tels que des consoles de jeux PSP de Sony et iPhone/iPod touch dApple.
29
(Schma de la technologie SVC et des connexions entre chaque Layer) Voici la situation qui pourrait se produire dans quelques annes, lorsque cette technologie se sera dveloppe. Un seul fichier lisible partout et surtout diffrents supports.
Cette technologie permettrait, vous lavez compris, de se passer du versionnement des fichiers ; un fichier global pouvant tre visionn partout la fois ! Cest la fois ce qui fait la force de ce format extrmement flexible, mais aussi sa faiblesse, car pour rendre ce fichier accessible au plus grand nombre, il sera surement ncessaire de tirer la qualit vers le bas. Cependant, la taille du fichier augmentant de manire significative, la question suivante peut tre pose : vaut-il mieux possder plusieurs fichiers pour tous les diffrents moyens de diffusion, ou uniformiser le tout ?
30
2.1.3.2: Multi-View Video Coding (MVC) Il sagit de la technologie utilise pour apporter le cinma en 3 Dimensions domicile et au cinma. Comme pour la technologie SVC, le MVC est une extension du H.264. Cette technologie a t cre pour le codage stroscopique (limage en relief) partir de 2 points de vue. Cette norme a t finalise en Juin 2009 et est depuis devenue le standard utilis dans les Blu-ray 3D qui commencent arriver dans le commerce. Lors de ltablissement de cette norme, un critre essentiel a t respect : la rtrocompatibilit avec le format H.264. En effet, le MVC est compos de 2 images mises cte cte , comme les 2 images que vos yeux peroivent, la gauche et la droite, votre cerveau restitue limage en 3 Dimensions. Dans notre cas, le logiciel de dcompression, va restituer cette 3D avec un peu daide. A lheure o jcris ce mmoire, il est quasiment impossible de regarder une vido en 3D avec nos seuls yeux ! Si vous tes alls au cinma rcemment voir un film en Relief stroscopiques, il vous a fallu des lunettes. Ces lunettes sont dites actives , les 2 verres sont polariss la lumire, cest--dire que le verre gauche ne va laisser filtrer que limage gauche. Et inversement pour limage droite. Mais une vido est une succession de 24 images pour le cinma, 25, 30 voir bien plus pour le reste. (Informatique, jeux) Pour crer cette impression de relief les lunettes vont chacune leur tour occulter limage droite puis limage gauche. A trs haute vitesse bien entendu ! Au cinma, cela se produira donc 24 fois par seconde, et comme chaque image possde 2 points de vue, un film 3D au cinma doit afficher 48 images par seconde. La stroscopie ne sattaque pas exclusivement au cinma mais aussi au domaine du jeu vido, dans ce cas les contraintes techniques sont plus lourdes, un jeu ne se contente pas dafficher 25 images par seconde, et comme limage est gnre par un cran il est estim que pour avoir une image fluide il est ncessaire de produire au minimum 30 images par secondes dit FPS (Frame Per Second) soit au minimum 60 Fps du fait de la 3D. Pour en revenir au format MVC, celui-ci est capable dafficher jusqu 3 points de vue de la mme image, En utilisant 2 de ces images nous obtenons un rendu stroscopique mais si nous utilisons ces 3 images nous obtenons un rendu dit en 3 dimensions, une ralit virtuelle. Pour crer un fichier en MVC, il est donc ncessaire dutiliser une camra stroscopiques avec 2 ou 3 objectifs, celles-ci sont pour lheure utilises dans lindustrie du cinma exclusivement. Ensuite, il faut utiliser un logiciel dencodage qui va utiliser les algorithmes de ce format pour convertir les 2 images en fichier pouvant tre visionn par lutilisateur.
31
Les images sont ici prsents une une, la gauche puis la droite. Les lunettes vont soccuper docculter les images qui ne correspondent pas. Lavantage de cette mthode est que chaque image arrive dans sa rsolution maximale Mthode cte cte (Side-by-Side)
Les images arrivent ici cte cte, le logiciel de dcompression va se charger de nafficher quune image, en runissant les 2 images laide des lunettes. Linconvnient est que pour une vido dune rsolution donne, les images sont ici cte cte, donc lors du visionnage on perd 50% de la taille de limage.
Cette technologie napporte pas vraiment de rvolution mais permet cependant dapporter la 3D stroscopique. Mais pour le moment le port obligatoire de lunettes et lachat de matriels compatibles en sont les principaux freins.
Le problme du port de lunettes a de fortes chances dtre corrig, certains acteurs du march travaillent sur des crans 3 dimensions ne ncessitant pas de lunettes, et dautres comme Disney travaillent sur de nouveaux algorithmes permettant de rduire linconfort que certaines personnes ressentent pendant le visionnage de film en relief.
Il sera intressant de suivre les volutions de cette technologie, car la 3D sera un jour dans nos foyers.
32
Mme si le VC-1 est encore utilis, le H264 a fini par simposer, car il est plus performant et dispose dun taux de compression plus lev pour une utilisation moins lourde du CPU. En effet, le VC-1 est de moins en moins utilis dans les supports commerciaux, au bnfice du H.264. Comme on peut le voir sur ce tableau comparatif, les caractristiques techniques sont assez semblables, mais le format de chrominance cest--dire le respect des couleurs dorigine de ce format noffre pas les mmes rglages. Le VC-1 naccepte que le 4:2:0 or lindustrie du cinma utilise au minimum le 4:2:2. Autre inconvnient, son poids pour un fichier de qualit DVD soit 720x576 le dbit moyen est de 4Mb/s.
33
Et surtout, il ne dispose pas des technologies de codage entropique. Ce format nest pas abandonn mais il nest pas destin voluer lheure actuelle. Voici un aperu de ce que donne le VC-1 en terme de rendu dune image contraste. Aperu VC-1 Profil Main :
34
Vous laurez not, le nom de ce CODEC est assez proche du format H.264. Cest tout fait normal, il sagit de son pendant Open-Source, celui-ci est bas sur une bibliothque libre sous licence GNU, issu dun projet du groupement VideoLAN en 2008. Ce nest pas proprement parler un format diffrent, mais un CODEC diffrent. Il permet dencoder des vidos dans le format H.264. Il possde les mmes spcificits que le codec H.264. Toutefois tant libre, il nest pas soumis aux cots de la licence dexploitation des brevets H.264, lui permettant ainsi dtre implment dans diffrents logiciels gratuits, offrant ainsi au grand public de pouvoir raliser des encodages H.264. Ce format est trs souvent prsent dans les fichier Matroska (.MKV) ce sont des transcodages de film en qualit Blu-ray H.264 ayant des dbit de 30Mb/s en moyenne. Le codec x.264 est utilis pour transcoder ces fichiers, pour les allger , leur permettant dtre plus facilement diffusables ! Celui-ci tant souvent utilis pour le piratage de film, il est malheureusement associ cette pratique. Mettons ici de ct laspect illgal de ce process ; le codec est assez performant puisquil permet de crer des fichiers HD en 720p denviron 4 6Go ou des fichiers 1080p denviron 7 9Go au lieu des 30 35Go du fichier dorigine prsent sur le Blu-ray, autorisant ainsi un utilisateur publier et diffuser sur internet ces fichiers de qualit semblable et les rendre accessibles au plus grand nombre et gratuitement.
Ce codec est prsent dans divers programmes souvent gratuits mais pointus, ceux-ci sont souvent utilisables en ligne de commande cest--dire sans interface graphique, donc il est ncessaire de passer par des commandes souvent difficiles pour les nophytes ! Cependant, il existe un dfaut. Il arrive souvent que certains fichiers .MKV ayant t encods en x.264 soient dfectueux : en effet il nest pas rare de rcuprer un fichier qui pendant sa dcompression va rencontrer quelques problmes de dcomposition, ou simplement de lourdeur. Ces fichiers sont toujours soumis au besoin de puissance de certaines machines, et certaines scnes peuvent tre plus complexes dcoder du fait de lutilisation de dbit Variable fortes amplitudes. De par mon exprience, je nai jamais pu visionner un fichier sans saccade ou sans apparition dartefacts visuels, de la mme qualit que le fichier dorigine dont il est issu.
35
36
37
Le mme fichier (Scott Pilgrim bande Annonce 1080p en Motion JPEG) a t encod avec le logiciel Gratuit Handbrake pour les fichiers H.264 et le programme FFmpeg2theora (en ligne de commande) pour le Theora
Temps de travail : - H.264 : 5minutes - Ogg Theora : 15 Minutes Le dbit est identique pour les 2 fichiers, 900Kbits. Un dbit volontairement bas pour de la Full HD, car nous pourrons plus facilement voir les diffrences l il nu. Limage slectionne affiche un certain contraste de couleur sur son fond avec plusieurs dgrads, ainsi que plusieurs niveaux de dtails complexes (vtements, visage et cheveux)
On remarque tout de suite un cart important du temps de travail ncessaire au transcodage, preuve que les algorithmes du format Theora ne sont pas aussi optimiss que celui du format AVC/H.264, qui lui est pourtant plus complexe.
On distingue trs clairement les diffrences au niveau de ces 3 images, le fait davoir utilis une vido en FullHD (1920x1080) a vraiment permis de faire ressortir les dfauts de limage. Les images sont ici affiches en taille relle, une rduction de ces images aurait induit une diffrence moins probante. Ce comparatif permet de diffrencier AVC/H.264 et Ogg Theora, au niveau qualitatif ; dbit gal le Theora est moins performant, il est plus long transcoder et son rendu visuel est bien infrieur celui du H.264 avec ou sans codage entropique CABAC.
38
39
40
Ogg Theora
41
42
Ces images sont tires du site www.streamingmedia.com, et de larticle "First Look: H.264 and VP8 Compared
43
Conclusion et Prospective:
Tout au long de mon dveloppement, jai voulu dmontrer que le format vido AVC/H.264 deviendra le format universel de captation, de production et de diffusion, et pourra sadapter tous les usages prsents et futurs.
Ce format sera-t-il rellement la solution aux attentes des utilisateurs (particuliers et professionnels), en terme de demandes de Qualit Audiovisuelle et dAccessibilit Universelle ?
Au travers de ce mmoire, nous avons pu mettre en vidence plusieurs contradictions dans cet univers de vido Professionnel et Grand Public. En premier lieu, lopposition flagrante du libre et du propritaire, lun gratuit lautre non. Mais leurs possibilits ne sont pas les mmes. Idologiquement, le choix se fait sur lun ou lautre des canaux de diffusion (Internet ou Commercial) LInternet tant un endroit nayant pas ou peu de contrle et o certains voudraient lemploi de technologie 100% libre, il devient naturel que le libre soit galvanis par cette dynamique communautaire qui va de pair avec le libre. Cependant, nous lavons dmontr, le format libre concurrent nest pas aussi efficace que son quivalent propritaire ! Un format libre est dvelopp par une communaut dutilisateurs souvent experts dans leur domaine ; un format propritaire est dvelopp dans un laboratoire danalyse de grands instituts de recherche. Souvent lexpertise est bien meilleure et le mode de dveloppement est plus efficace, ainsi que les budgets de dveloppement. Je ne peux pas juger de la qualit du travail de ces communauts, cependant au rsultat final certaines technologies dveloppes ne peuvent supplanter un travail propritaire. Dans le cadre dun usage Internet, la diffrence est peu perceptible car les fichiers tant de taille et de rsolution plus rduite quun fichier commercial, les dfauts apparaissent peu ou pas. Enfin, nous allons rentrer dans le sujet qui fait dbat lheure actuelle, le gratuit et le payant. Internet est un formidable moyen de visionner des vidos, le streaming a pu apporter la capacit de visionner un film tous ceux qui ne peuvent tlcharger un fichier complet avec leur bande passante limite. Par consquent, les fichiers transmis en streaming se veulent lgers, et un encodage vido lger veut dire petit Bitrate, donc qualit amoindrie. On peut opposer cela laspect commercial mais qui nest pas forcment diaboliser, car tout le monde achte des DVD, et se met peu peu squiper en lecteur Blu-ray, et bien sr si vous disposez dune tlvision compatible ! Ici, le fichier est taill pour avoir une qualit prmium, un son et une qualit visuelle proche ou identique au film sorti en salle. Le message envoy aux consommateurs est simple, sil veut de la qualit il doit acheter un fichier Haute Dfinition ; il existe certes une alternative avec les fichiers MKV contenant une vido au format H.264, mais ces fichiers sont trop souvent soumis des erreurs de dcompression, comme lapparition dartefacts visuels. Daprs moi, ils ne peuvent avoir une relle valeur pour le consommateur voulant une vraie exprience audiovisuelle !
44
La plante Internet se partage entre deux gants : Google et le consortium MPEG LA qui souhaitent tous les deux la plus grande part du march de la diffusion audiovisuelle dans le monde, tous supports confondus. MPEG LA est propritaire du format AVC/H.264 (objet central de cette tude) dj trs rpandu dans nos ordinateurs et sur nos sites Internet. Google, principal moteur de recherche sur Internet est propritaire de YouTube, le principal portail de diffusion vido sur Internet avec plus de 2 milliards de clips visionns quotidiennement. Google annonce aujourdhui la libration complte des droits sur la technologie du nouveau codec vido de On2 nomm VP8 en ouvrant son code source pour que nimporte quel programmeur puisse lutiliser. Ceci aura pour effet de le rendre gratuit lutilisation et on devrait voir apparaitre dici quelques mois des applications permettant dencoder dans ce nouveau format vido qui on a adjoint le format dj libre de droits Ogg Vorbis pour la partie audio. Ainsi est n le conteneur WebM. En face, le consortium MPEG LA renonce, jusqu fin 2015 faire payer systmatiquement des licences pour l'utilisation du format vido H.264 sur Internet. A partir de 2016, la redevance sera exige y compris pour l'encodage de vidos gratuites pour l'utilisateur, comme celles proposes sur YouTube ou DailyMotion. Toutefois, celui-ci a annonc la gratuit, pour toute la dure de vie de ce format, des droits pour toutes vidos publies sur internet, pour un usage 100% internet. Ces annonces sont lourdes de sens. Devant un conflit qui met en opposition des intrts financiers, technologiques et idologiques considrables, le W3C (World Wide Web Consortium, organisme de standardisation but non-lucratif, fond en octobre 1994, charg de promouvoir la compatibilit des technologies WWW) a refus de dsigner les codecs vido standards utiliser avec le HTML5, qui facilitent l'incrustation de vidos dans les pages web. Libre ainsi chaque diteur de navigateur de choisir les formats qu'il souhaite prendre en charge, et chaque diteur de sites web de choisir le ou les formats qu'il souhaite utiliser. Cette gratuit consentie par le consortium MPEG LA n'est pas vraiment un cadeau, plutt un pige qui se refermera sur le web et le logiciel libre en 2016, en favorisant par dfaut le conteneur WebM de Google. Les intrts de ces deux gants sont contradictoires dans le sens o Google vend un service complet valeur ajoute, alors que MPEG LA vend lusage (la licence) dune technologie dencodage qui sert de support des services valeur ajoute. Les cinq annes qui viennent seront dcisives pour le format AVC/H.264, et il y a fort parier que ce sont les partenaires comme Microsoft, Adobe, Mozilla, et des entreprise et services qui nexistent pas encore, qui feront voluer les stratgies actuelles. Mme si Google russit imposer son standard de diffusion, il est fort probable que le format AVC/H.264 ne disparaitra pas aux oubliettes de lhistoire Internet, mais deviendra le format de rfrence de la Vido la Demande (VoD), de la Tlvision Numrique Terrestre (TNT) et dautres mdia comme le tlphone ou les tablettes numriques, puisque le format H.264 est associ la notion de qualit visuelle et de fichiers respectant les normes de diffusion.
45
1.3 Notions de structure dun fichier Vido .................................................................................................... 9 1.4 Notion de dbit de donnes (Bitrate) ..................................................................................................... 11 2 - Etude Avance du Format vido AVC/H.264................................................................................................ 12 2.1 Prsentation Technologique ................................................................................................................... 12 2.1.1 Technologie ...................................................................................................................................... 12 2.1.2 Apports et Etude Comparative ......................................................................................................... 21 2.1.3 : Technologies Evolutives de ce format ............................................................................................ 27 3- Solutions Alternatives : Formats Propritaires et Open-source .................................................................. 33 3.1 VC-1 (Format Propritaire) ................................................................................................................... 33 3.2 X.264 (CODEC Alternatif) ...................................................................................................................... 35 Un Contexte conomique et technologique: ................................................................................................ 37 3.3 Ogg Theora (format open-source) ........................................................................................................ 37 Voici un comparatif visuel du mme fichier encod en H.264 et en Theora ............................................ 38 3.4 WebM (VP-8) (Format open-source) .................................................................................................... 42 Voici un petit comparatif visuel entre le VP8 et lAVC/H.264 ................................................................... 43 Conclusion et Prospective: ................................................................................................................................ 44 Annexes : ........................................................................................................................................................... 47 Lexique :......................................................................................................................................................... 47 Bibliographie :................................................................................................................................................ 50 Notes : ........................................................................................................................................................... 51
46
Annexes :
Lexique :
Bitrate : le dbit binaire est une mesure de la quantit de donnes numriques transmises par
unit de temps. Il est gnralement exprim en bits par seconde (bit/s, b/s ou bps). Constant Bitrate (CBR) est un terme anglais que l'on peut traduire en franais par : taux d'chantillonnage fixe , en opposition au variable Bitrate (VBR), qui peut se traduire en franais par : taux d'chantillonnage variable
47
Luminance
aux couleurs fondamentales qui sont notes : R pour le rouge G pour le vert (green en anglais) B pour le bleu
On peut par commodit dcomposer ce signal en trois autres composantes. La luminance est alors la partie du signal vido correspondant l'intensit lumineuse produite, soit le niveau entre le noir et le blanc. La couleur et l'intensit de cette couleur correspondent l'autre partie du signal, appeles respectivement chrominance et saturation.
48
49
Bibliographie :
Ouvrages de rfrence :
The H.264 Advanced Video Compression Standard, Second Edition 2010 De Iain E. Richardson http://www.vcodex.com/h264mpeg4/index.html Biographie http://www4.rgu.ac.uk/eng/aboutus/page.cfm?pge=3284
Sites internet :
H.264 AVC http://www.vcodex.com/h264.html http://en.wikipedia.org/wiki/H.264/MPEG-4_AVC http://www.hdfever.fr/2009/03/22/le-h264-le-codec-le-plus-avance-au-monde/#installation SVC Site internet Camera Video - Forum http://www.cameravideo.net/forum/news-de-video/13724-h-264-svc-un-format-unir.html Site internet Fraunhofer Institut http://ip.hhi.de/imagecom_G1/savce/index.htm Article Wikipdia http://fr.wikipedia.org/wiki/Codage_vido_scalable Dossier France Telecom datant de 2006 http://www.orange.com/fr_FR/innovation/actus/thematique/tous_les_dossiers/att00006850/ddm_200605f r.pdf Application dune technologie SVC concurrente http://www.hdfever.fr/2010/03/05/smooth-streaming-silverlight-avc-svc-h264-youtube-sous-titre/ tutoriel http://www.eetimes.com/design/industrial-control/4017613/Tutorial-The-H-264-Scalable-Video-Codec-SVCoutils danalyse des fichier SVC - SVC Analyzer 2.0 http://www.svc-analyzer.com/index.php/svc-analyzer-20.html Ogg Theora: Site internet Gnraliste Ars Technica http://arstechnica.com/open-source/news/2010/02/ogg-theora-vs-h264-head-to-head-comparisons.ars Google WebM : Site Internet Le site du Zro http://www.siteduzero.com/news-62-36515-google-libere-le-codec-video-vp8.html Article Wikipdia http://fr.wikipedia.org/wiki/WebM Comparatif WebM & Theora http://www.fansub-streaming.eu/blog/test-webm-vs-theora.html Blog http://blog.nicolargo.com/2010/05/encodage-de-video-webm-en-ligne-de-commande.html
50
Notes :
51
52
53
Philippe Gourgand Etudiant en Licence Pro Conduite de Projet TIC dans les PME Salari chez UbicMedia SAS Europe Numriseur Passionn de vido et de cinma
Rsum : Au travers de ce mmoire, je vais vous montrer que le format vido Advanced Video Coding/H.264 (AVC/H.264 ou h.264) devient le format universel de captation, de production et de diffusion, et sadapte tous les usages prsents et futurs. Ce format est-il rellement la solution aux attentes des utilisateurs (particuliers et professionnels), en terme de demandes de Qualit Audiovisuelle et dAccessibilit Universelle ? Pour rpondre cette problmatique, nous devrons comprendre cette technologie, la resituer dans lensemble des formats vido numriques existants et ainsi pouvoir en mesurer limpact sur le futur.
Mots cls :
Video Compression: Il sagit de la mthode de compression de donnes, utilise pour rduire la quantit de donnes dun fichier vido (Video et Son). Le but est de trouver le meilleur rapport Poids/Qualit pour ne pas dnaturer une vido. Son principal intrt est de rduire le poids des fichiers, amliorant aussi la transmission dinformations. Encodage/transcodage: Le terme encodage signifie toute opration de codage dun objet en donnes informatiques. Le transcodage est lopration par laquelle on passe pour changer le format de codage dun media (vido et audio). Cela permet dadapter le format en fonction du support sur lequel il est, stock, transport et diffus. MPEG-4: Il sagit dune norme dobjets audiovisuels dfinie par le consortium Moving Picture Experts Group (MPEG). Cette norme dfinit des fichiers pour diffrents usages (internet, tlvision, jeux vido) AVC (Advanced Video Coding) - H.264: Il sagit dune norme de codage vido, ayant pour but damliorer lefficacit du codage vido par rapport dautres formats. Elle apporte aussi plusieurs technologies permettant un meilleur respect de la qualit dorigine. Dbit (Bitrate) : Le dbit est une mesure quantitative, permettant de mesurer les donnes numriques transmises en ko/s, Mo/s On peut aussi lappeler la bande passante . En vido, plus le dbit est lev et plus grande sera la qualit ! Scalabilit temporelle, spatiale, qualitative : Le terme Scalabilit est un anglicisme dsignant lextensibilit dun processus, dun rseau, dun systme. En vido, ce terme est utilis pour dsigner une opration permettant de modifier laspect visuel, la taille et la qualit. CODEC : Cette appellation vient de compression-dcompression , il sagit dun procd permettant la compression et la dcompression de donnes numriques. Il peut sagir dun outil matriel ou dans notre cas, dun logiciel.