Sie sind auf Seite 1von 56

IUT A, Universit Claude Bernard, Lyon 1 UbicMedia Europe

Mmoire de Licence Pro Conduite de Projet TIC dans les PME

[Etude comparative des Technologies dencodage Audio-Visuel pour lInternet et le Multimedia]


Etude avance du format de fichier Vido numrique AVC/H.264

Philippe Gourgand

[2010]
Tuteur en entreprise : M. Perrin Enseignant Suiveur : M. Odin Enseignant Lecteur: Mme. Bureau

Remerciements

La rdaction de ce mmoire ma permis de rencontrer des gens nouveaux, qui mont apport beaucoup daide et de soutien dans mes recherches et que je souhaite aujourdhui remercier. Tout dabord, je tiens remercier Vronique Cohen et lquipe pdagogique de lIUT qui mont donn envie dapprofondir les comptences ncessaires pour conduire un projet dans le secteur du multimdia dans une entreprise, au point de mamener aujourdhui rdiger un mmoire traitant de ce sujet. Au cours de cette anne, une autre personne a fortement influenc mes choix quant lorientation de mon mmoire et lintrt que je porte tout ce qui touche aux aspects technologiques du secteur du multimdia. Je souhaite donc ici saluer Alain Rosset PDG dUbicMedia SAS qui ma fait confiance en signant ce contrat dapprentissage avec moi et qui mencourage encore aprs cette anne passe ensemble dans cette direction. Je tiens galement adresser des remerciements sincres Bertrand Perrin, directeur technique et maitre dapprentissage qui ma apport une aide prcieuse dans la rdaction de ce mmoire. Je tiens remercier aussi Lionel Martin qui ma apport un regard clair (et toutes les documentations techniques lire en anglais). Enfin, je remercie tous ceux qui mont apport leur soutien et leur aide au cours de cette anne, ma famille et plus spcialement mon pre, qui a su me soutenir dans mes priodes de doute et sans qui lachvement de ce travail aurait t beaucoup plus difficile, sans oublier ma mre pour son grand sens de lorthographe...

Mon entreprise

UbicMedia SAS, socit fonde en 2006.


Sa principale activit est de dvelopper une solution de protection de contenus vido PUMit ainsi que de promouvoir celle-ci. Cette solution requiert de la part de layant droit, de fournir un fichier MPEG-4 (dont nous parlerons dans lintroduction de ce mmoire), puis une fois le fichier Pum celui-ci devient illisible et non visionnable pour une personne qui naurait pas les droits de visionnage ! Tout en permettant la libre circulation du fichier sur lInternet, et aux personnes voulant acqurir lgalement les droits de visionnage, de pouvoir faire cette dmarche simplement. Ces fichiers ainsi protgs ne sont accessibles quen tlchargement, et non en streaming. La dmarche de ce mmoire, tait de promouvoir au sein de lentreprise, ladoption dun nouveau format, le H.264, dont le sujet de ce mmoire est ddi, dans une optique de fichier tlchargeable et non en streaming.

Philippe Gourgand Licence CPTIC - 2010

Table des matires


Remerciements.................................................................................................................................................... 1 Introduction : ....................................................................................................................................................... 3 Historique : ...................................................................................................................................................... 4 1 Description de la Vido Numrique et formats de diffusion :....................................................................... 5 1.1 Notions de Production et Diffusion ........................................................................................................... 5 1.2 Notion de CODEC ....................................................................................................................................... 6 La fonction Codage (Compression): .................................................................................................... 6 La fonction Dcodage (Dcompression): ............................................................................................ 6 La fonction Transcodage (changement de CODEC) : ........................................................................... 7

1.3 Notions de structure dun fichier Vido .................................................................................................... 9 1.4 Notion de dbit de donnes (Bitrate) ..................................................................................................... 11 2 - Etude Avance du Format vido AVC/H.264................................................................................................ 12 2.1 Prsentation Technologique ................................................................................................................... 12 2.1.1 Technologie ...................................................................................................................................... 12 2.1.2 Apports et Etude Comparative ......................................................................................................... 21 2.1.3 : Technologies Evolutives de ce format ............................................................................................ 27 3- Solutions Alternatives : Formats Propritaires et Open-source .................................................................. 33 3.1 VC-1 (Format Propritaire) ................................................................................................................... 33 3.2 X.264 (CODEC Alternatif) ...................................................................................................................... 35 Un Contexte conomique et technologique: ................................................................................................ 37 3.3 Ogg Theora (format open-source) ........................................................................................................ 37 Voici un comparatif visuel du mme fichier encod en H.264 et en Theora ............................................ 38 3.4 WebM (VP-8) (Format open-source) .................................................................................................... 42 Voici un petit comparatif visuel entre le VP8 et lAVC/H.264 ................................................................... 43 Conclusion et Prospective: ................................................................................................................................ 44 Annexes : ........................................................................................................................................................... 47 Lexique :......................................................................................................................................................... 47 Bibliographie :................................................................................................................................................ 50 Notes : ........................................................................................................................................................... 51

Philippe Gourgand Licence CPTIC - 2010

Introduction :
Chaque jour, lorsque vous allumez votre tlviseur, votre ordinateur, votre tlphone portable, vous visionnez des clips vido, des extraits de films, des missions de tlvision, avec votre Smartphone, votre camscope, vous saisissez en vido des scnes entre amis. Chacune de ces vidos est numrique et diffuse comme tel par lInternet, les chaines de tlvision TNT, les oprateurs tlphoniques, les sites de diffusion comme YouTube ou DailyMotion et autres supports DVD ou cls USB. Pour lutilisateur final que nous sommes, ces images sont seulement diffrencies par le format (hauteur par largeur) et lcran de diffusion (petit ou grand) : la notion de format importe peu lutilisateur puisque la technologie est l pour afficher presque nimporte quelle image sur nimporte quel cran. Pourtant, lutilisateur lambda est familiaris avec les formats du cinma : Super8mm, 16mm, 35mm, cinmascope, Panavision, et les formats de la tlvision : SECAM en France, PAL en Allemagne, NTSC aux Etats Unis. Chacun de ces formats voque des notions de qualit dimage (familiale pour le super8 ou professionnelle pour le cinmascope), des spcificits gographiques et donc difficilement compatibles entre les pays : une cassette VHS achete aux USA ne pouvait tre lue sur un magntoscope franais. Dans le monde du numrique daujourdhui, il en va de mme. De multiples formats sont apparus pour fabriquer des photos et des vidos, lutilisateur se perd entre les formats de prise de vues, de retouche, de diffusion ou de stockage, et leurs incompatibilits. Pourtant, une homognisation des technologies du numrique est en train de voir le jour : Quel est le point commun entre les vidos diffuses par le clbre site YOUTUBE, le flash incontournable sur Internet, la TNT haute dfinition et le Blu-ray ? Le format vido Advanced Video Coding/H.264 (AVC/H.264 ou h.264). Au gr de mes premires expriences professionnelles, jai utilis diverses technologies dans le domaine de la vido et de lInternet, et dernirement, au cours de la mission que ma confie mon maitre dapprentissage, jai t amen tudier ce format dans toutes ces composantes. Ltude mene depuis un an ma permis dapprhender cette technologie dans sa globalit, grce tous les usages que jai pu observer et raliser. Au travers de ce mmoire, je vais vous montrer que le format vido Advanced Video Coding/H.264 (AVC/H.264 ou h.264) devient le format universel de captation, de production et de diffusion, et sadapte tous les usages prsents et futurs. Ce format est-il rellement la solution aux attentes des utilisateurs (particuliers et professionnels), en terme de demandes de Qualit Audiovisuelle et dAccessibilit Universelle ? Pour rpondre cette problmatique, nous devrons comprendre cette technologie, la resituer dans lensemble des formats vido numriques et ainsi pouvoir en mesurer limpact sur le futur.

Philippe Gourgand Licence CPTIC - 2010

Historique :
En janvier 1988, le Motion Picture Expert Group (MPEG) runit les experts de lOrganisation Internationale de Normalisation et la Commission Electrotechnique Internationale (ISO/CEI) pour dfinir un systme normalis de codage de contenus cinmatographiques, le MPEG-1. Le MPEG-1 est ainsi la premire norme prsente pour les applications multimdia. Elle sera ensuite complte par la norme MPEG-2 pour les applications du domaine de la radiodiffusion. La norme MPEG-2 est structure en profils et niveaux et, pour chacun d'eux, le dbit binaire maximum que le dcodeur doit pouvoir traiter est clairement dfini. Une fois normalise, MPEG-2 a t trs largement utilise (DVB Norme TV europenne, ATSC Norme TV USA, DVD, etc.). A l'instar de la plupart des autres mthodes de codage, MPEG-2 dfinit uniquement la syntaxe du flux binaire et les caractristiques du dcodeur, laissant aux fabricants le loisir d'appliquer l'algorithme ct codeur. Pour ces raisons, les codeurs MPEG-2 affichent des performances diffrentes selon le type d'algorithme affect la compensation de mouvement, les valeurs de la matrice de quantification et le dispositif de contrle du dbit. En 1999, apparait le premier successeur de la norme MPEG-2, le MPEG-4, partie 2 publie par l'ISO. Comme dans le cas de MPEG-2, l'efficacit du codage est troitement lie la complexit du matriel de source et la mise en uvre du codeur. MPEG-4 a t dfinie pour des applications multimdia faibles dbits binaires, puis tendue aux applications du domaine de la radiodiffusion. Une valuation officielle subjective indique que le codage MPEG-4, partie 2, offre un gain d'efficacit de 200 400 % par rapport MPEG-2. Ainsi, pour les applications DVB (tlvision numrique europenne), ce gain n'est pas suffisant pour justifier une migration du MPEG-2 vers le MPEG-4, partie 2. En 2001, soucieuses de mettre au point un systme de compression plus efficace, les instances de normalisation ISO/CIE (MPEG) et lUnion internationale des Tlcommunications (UIT) conjuguent leurs efforts au sein du groupe de travail Joint Video Team (JVT) charg de dvelopper le systme de codage Advanced Video Coding ou AVC. En 2003, le systme AVC est intgr en tant que partie 10, la norme MPEG-4 (ISO/ IEC 14496-10) et repris sous lappellation H.264 (H.264/AVC (MPEG-4, Part 10)). En septembre 2004, le consortium DVB modifie la norme TS 101 1542 (Implmentation Guidelines for the Use of Vido and Audio Coding in Broadcasting Applications based on the MPEG-2 Transport Stream) afin d'y inclure galement AVC/H.264.

Philippe Gourgand Licence CPTIC - 2010

1 Description de la Vido Numrique et formats de diffusion :


1.1 Notions de Production et Diffusion
Avant de commencer parler du format H.264 (H.264/AVC (MPEG-4, Part 10), il est primordial dexpliquer tout dabord certaines notions, ceci dans le but dapprhender cette tude de la meilleure manire possible. On parle de format numrique partir du moment o un film vido est ralis, en comparaison dun film cinma tourn et mont en Super8, 16mm, 35mm, cinmascope, ou Panavision. Un film vido est tourn avec une camra numrique et enregistr, soit sur bande magntique, soit directement sur disque dur ou carte mmoire. Il est ensuite mont laide de logiciels, appels diteurs de montage vido, plus ou moins spcialiss et professionnels, en fonction du niveau dexpertise des personnes et surtout en fonction de lobjectif de diffusion de luvre : cinma, tlvision, DVD, internet, film de vacances Pour tourner et monter un film vido, les constructeurs de matriels et leurs technologies nous obligent utiliser diffrents formats : la camra enregistre dans un format propre la captation dimages, sa dfinition standard ou haute, et au support denregistrement utilis par la camra. Le logiciel de montage, lui, est capable de monter les images dans diffrents formats, en fonction de lusage final qui sera fait du film vido. Ces diffrents formats de fichiers vido numriques, se classent en deux catgories : les propritaires, dvelopps par les constructeurs de camras, les diteurs de logiciels de montage et deffets spciaux et les Institutions internationales et Joint-Ventures, comme le Motion Picture Expert Group (MPEG), et les libres provenant dOrganisations non lucratives de dveloppeurs dapplications et de formats libres de droits. Il va de soi que les formats dits propritaires permettent leurs auteurs de percevoir des royalties chaque intgration dans un systme dencodage. Exemples de formats : Propritaires : - Les diffrentes normes MPEG : .MPG / .mp4 - Microsoft Windows Media Video : .WMV - Apple QuickTime : .mov - Real Video : .rm / .rmvb Libres : - Ogg Theora : .ogg - Dirac Video Parmi ces formats de fichier, il convient de diffrencier : Les formats de captation (production) utiliss par les camras Grand Public (DV, HDV, AVCHD), et Professionnel : AVCHD, P2, ProHD, DVCam, XDCam, HDCam, Digital Betacam. Format de diffusion Ce sont les formats de fichier qui sont utiliss le plus souvent en lecture, cest--dire partir dun ordinateur avec un logiciel Player particulier, ou sur un tlphone par exemple.

Philippe Gourgand Licence CPTIC - 2010

1.2 Notion de CODEC


CODEC est labrviation de COmpresseur-DECompresseur. Un codec est une application capable de compresser et/ou dcompresser un signal numrique audio/vido en lencodant et/ou le dcodant. Il existe deux types de CODEC : les CODEC logiciels et les CODEC matriels On peut comparer le codage dun film vido aux perforations sur le bord dun film cinma. Dans les deux cas, ce processus correspond la ncessit de normer avec prcision un format (16/35mm ou MPG1/MPG2, par exemple) dans le contexte dun usage prcis : projection sur grand cran, sur tlviseur, sur tlphone, Il existe de trs nombreux codec, dont la plupart sont dj installs dans les systmes dexploitation (Windows, Mac, Linux, ) des ordinateurs, lecteurs multimdia, tlphones, Les Codecs encodent des flux pour la transmission ou le stockage, et dun autre ct, dcodent ces flux pour ldition ou la restitution du flux.

La fonction Codage (Compression): La fonction de codage (ou dencodage) est la compression de donnes, ou codage, qui consiste transformer une suite de bits A en une suite de bits B plus courte, contenant les mmes informations, en utilisant un algorithme particulier. Cette opration de codage, consiste changer la reprsentation de l'information, dans le but de rendre la reprsentation compresse plus courte que la reprsentation originale. La dcompression est l'opration inverse de la compression.

La fonction Dcodage (Dcompression): La fonction de dcodage, ou dcompression, est la lecture du fichier numrique audio/vido. Pour quune vido soit lisible sur un ordinateur ou tout autre lecteur multimdia, il faut donc que le CODEC appropri y soit install (et dans le cas dun CODEC matriel, que soit prsente une carte de dcompression). On dit quun CODEC est performant en lecture si limage quil affiche est nette, sans saccade et ne consomme pas abusivement la puissance du processeur. La lecture du fichier numrique audio/vido se fait grce un logiciel intgrant le CODEC appropri. Ces applications de lecture sont des logiciels de lecture simple et des logiciels d'dition : logiciel de montage vido, audio, logiciel d'animation, logiciel deffets, logiciel 3D. Certains sont de vrais gestionnaires de donnes multimdia permettant d'acheter des fichiers en ligne et de grer les DRM. D'autres sont capables grce un moteur de recherche local de cataloguer et organiser ces donnes, ils offrent aussi des fonctions plus avances comme des rglages de colorimtrie. Ces logiciels utilisent des players pour visualiser le contenu multimdia et permettent la lecture de Au travers de cette tude, nous allons mtadonnes. observer des tests excuts avec La plupart des formats audio/vido numrique se reconnaissent diffrents logiciels de transcodage. par la forme de leur enveloppe de transport (on dit que les Cela ayant pour but de confronter formats sont encapsuls), comme le MPG, lAVI de Microsoft leurs performances, (Audio Video Interleave) ou le Quicktime (.MOV) dApple. Mais aussi bien lors de transcodages que ces enveloppes ne permettent pas didentifier le CODEC utilis. lors de dcodages. On constate, linstar de Google, que Microsoft et Apple dveloppent en interne leurs propres CODEC et les implantent dans leurs systmes dexploitation. Philippe Gourgand Licence CPTIC - 2010
6

La fonction Transcodage (changement de CODEC) : Le transcodage, en vido et/ou en audio, est le fait de changer le format de codage dun mdia en le comprimant ou lencapsulant. Le transcodage permet d'adapter le format du mdia au support sur lequel il est transport, stock ou diffus. Il est aussi utilis pour adapter le mdia aux matriels, aux normes diffrentes en vue de son traitement (interoprabilit). On notera qu'il ne s'agit pas d'un codage au sens strict du terme car le plus souvent la transformation comporte des pertes. Ainsi, le format SVCD par exemple, permet de faire contenir un film de plus d'une heure sur un support de 650 Mo (CD), au prix d'une qualit d'image moins bonne qu'un DVD (4,7Go) en raison du codec utilis pour parvenir cela : on parle alors dun codec destructif. On adaptera donc, soit la qualit du mdia une quantit de donnes d'information (rsolution, finesse des dtails) compatible avec le support envisag au transport, au stockage ou la diffusion du mdia, soit sa quantit d'information vhicule en modifiant par exemple le nombre d'images par seconde d'une vido, ou en changeant sa dfinition.

Philippe Gourgand Licence CPTIC - 2010

(Schma de transcodage vers diffrents supports)

Philippe Gourgand Licence CPTIC - 2010

1.3 Notions de structure dun fichier Vido


Un fichier vido est compos de plusieurs parties ; Le Flux vido, cet lment ne contient que les informations ncessaires pour afficher la vido. Le type de flux est dtermin par le CODEC utilis (COdage /DECodage) Il est aussi dfini par le nombre dimages par secondes (Frame Per Second-FPS). En fonction de lutilisation voulue, cette donne est diffrente. Le nombre dimages par seconde est dfini ainsi : 25 images/sec (Europe) 30 images/sec (USA/ Japon) et 24 images/sec (Cinma) Le Flux audio, cet lment contient la ou les pistes audio incluses dans le fichier vido lire, il est possible en fonction des spcifications du fichier de contenir plusieurs pistes, comme sur un DVD par exemple. Les fichiers de sous-titres, il sagit en gnral de fichiers texte contenant les donnes spatiotemporelles permettant de synchroniser les textes avec le film. Le conteneur, ou container il sagit dune capsule qui va contenir en son sein le flux vido et le flux audio ainsi que les fichiers de sous-titres ; ainsi que dautres donnes comme une description des flux que contient le conteneur, des mtadonnes (auteur, date, etc.), des chapitrages. Ce conteneur a pour principale utilit de faciliter le transport et la lecture dun fichier. Le lecteur va ensuite se charger de sparer les deux flux pour les lire. Les principaux conteneurs vido sont : Advanced Streaming Format (extension : .asf) : dvelopp par Microsoft, Ogg Media (extension : .ogm) : dvelopp par Xiph.org, Windows Media Video (extension : .wmv) : dvelopp par Microsoft, Material eXchange Format (extension : .mxf) : standard de la SMPTE, Audio Video Interleave (extension : .avi) : dvelopp par Microsoft, Matroska (extension : .mkv) : dvelopp par CoreCodec, Inc., NUT Container (extension : .nut) : dvelopp par des dveloppeurs de MPlayer et FFmpeg, QuickTime (extension : .mov) : dvelopp par Apple, 3gp (extension .3gp ou .3g2) : dfini par le 3GPP, MPEG 1/2/4 (extension : .mpg ou .mpeg) : codec et conteneur dfini par le Moving Picture Experts Group, RealMedia (extension : .rm) : dvelopp par RealNetworks.

Il ne faut pas confondre format et conteneur ! Un conteneur .AVI peut contenir diffrents formats de fichiers

Philippe Gourgand Licence CPTIC - 2010

Chaque fichier vido possde un PROFIL, celui-ci correspond des caractristiques le destinant des applications diffrentes. Chaque profil a son utilisation finale. Ce profil est dfini lors du processus de transcodage par le logiciel, il est possible dinfluer manuellement sur ces rglages mais cela reste rserv aux utilisateurs expriments.

Chaque fichier vido possde aussi un NIVEAU (Level), qui lui est propre. Ce niveau, est une valeur comprise entre 1 (le plus bas) 5.1 (le plus lev) correspond des limitations sur un certain nombre de paramtres. Cela indique au logiciel de dcompression les ressources machine ncessaires pour dcompresser la vido. Plus son profil est lev, et plus sa dcompression va requrir de ressources.

Ces deux notions seront dtailles plus tard, dans la 2me partie de ce mmoire.

Philippe Gourgand Licence CPTIC - 2010

10

1.4 Notion de dbit de donnes (Bitrate)


Un critre essentiel pour juger de la qualit dun fichier, est la valeur de son dbit de donnes, appel le Bitrate. Le Flux audio et le flux vido ont chacun un dbit propre. Cette donne est exprime le plus souvent sous forme de valeur en Kilobit par seconde (Kb/s). Pour les fichiers de plus grande taille comme des vidos en Haute Dfinition (HD) celui-ci peut tre exprim en Mgabit par seconde (Mb/s) Il convient gnralement de dire, que plus le dbit est lev et plus la qualit du flux est excellente.

Il convient de diffrencier 2 types de Bitrate en vido : Le Dbit Constant (CBR) Le dbit du fichier est fix une valeur donne pour toute la dure de la vido et/ou de laudio. Lors du processus dencodage, on attribue une valeur de Bitrate, celle-ci correspond la qualit que lon veut donner au fichier encod. En fonction de la dfinition de la vido, cest--dire sa taille, celle-ci est exprime en pixel, comme la taille dun cran dordinateur. Plus la dfinition est importante, plus le Bitrate doit tre important, linverse si celle-ci est rduite, le dbit peut tre diminu.

Le Dbit Variable (VBR) Le dbit fix nest quune moyenne. Lors de squences ne ncessitant que peu dinformations la valeur va tre rduite automatiquement en fonction de la charge ncessaire, linverse pour les squences complexes, le dbit est augment. Ce type de dbit a lavantage certain de rendre un fichier de qualit suprieure. Puisque celui-ci va sadapter automatiquement la complexit de la vido. De plus, les fichiers encods ont un poids sensiblement infrieur ceux encods avec un dbit de type constant. Lamplitude, lcart entre le dbut minimum et le dbit maximum varie selon les choix de lutilisateur ou des paramtres prdfinis du logiciel. Cet cart peut tre extrme sans pour autant augmenter significativement le poids du fichier.

Exemple : une vido Haute Dfinition aura un Bitrate de 6Mb/s (voir 15Mb/s pour un film commercial) alors quune vido pour lInternet dans une dfinition plus standard pourra avoir une qualit correcte avec un dbit de 1Mb/S voire 1,5Mb/s si la vido est complexe.

Philippe Gourgand Licence CPTIC - 2010

11

2 - Etude Avance du Format vido AVC/H.264


Au travers de ce mmoire, nous allons dfinir ce quest le format Vido AVC/H.264, ses utilisations et ses volutions. Comme nous lavons vu prcdemment, le format AVC/H.264 a t conu pour remplacer les normes vieillissantes de vido aussi bien tlvisuelles que cinmatographiques. Dans cet objectif, le consortium charg de sa normalisation a dfini des critres respecter pour que ce format soit viable et surtout performant pour tre en mesure de remplacer la prcdente norme MPEG2. Au travers de diffrents tests et exemple concrets, nous allons observer comment se comporte le format AVC/H.264 dans ses utilisations, et en quoi ce format rpond aux attentes des consommateurs. Mais tout dabord, un peu de technique, Il serait difficile de dire quil sagit dune tude avance si nous nvoquions pas les aspects techniques qui sont lessence mme du format AVC/H.264.

2.1 Prsentation Technologique


2.1.1 Technologie Au travers de cette partie, nous allons prsenter et observer les technologies prsentes au sein de ce format, et pourquoi celui-ci est mme de rpondre aux besoins technologiques actuels. Le Format AVC/H.264 proprement parler est une norme. Celle-ci comprend diffrentes technologies qui doivent tre implmentes au sein des diffrents CODEC AVC/H.264 prsents sur le march. Avant tout, il faut savoir que lors de llaboration de ce format, le consortium MPEG avait inscrit au cahier des charges que ce nouveau format devrait apporter un gain de qualit thorique de 40% en terme de rapport Poids/qualit visuelle en opposition au format MPEG-4. Ce format possde diffrentes technologies lui permettant de compresser plus efficacement les vidos que les normes prcdentes (ex : MPEG-2 et MPEG-4 part 2 ASP) Une meilleure compensation des mouvements dans lutilisation des images dj encodes comme rfrences. Le choix de l'image de rfrence intervient au niveau MacroBloc et sous-MacroBloc. Ceci permet d'utiliser dans certains cas jusqu' 32 images de rfrence. Les prcdentes normes taient limites 2 images de rfrences. Une prcision au quart de pixel pour la compensation de mouvement, ceci permet davoir un rendu plus prcis des dplacements des zones mobiles. (Pour la chrominance, la prcision de la compensation de mouvement se fait mme au huitime de pixel.) Un filtrage anti-blocs, ce filtre est appliqu pendant lopration de transcodage, et a pour but de rduire les artefacts caractristiques dun codage par bloc. (pixellisation) Un codage Arithmtique (CABAC : Context-Adaptive Binary Arithmtiques Coding) qui est une technique sophistique de codage entropique qui produit d'excellents rsultats en terme de compression mais possde une grande complexit demandant une machine puissante pour tre dcod, (nest pas disponible dans tous les profils H.264)

Philippe Gourgand Licence CPTIC - 2010

12

Un codage adaptatif de type Huffman longueur variable (CAVLC : Context-Adaptive Huffman Variable-Length Coding) La numrotation des images permet la cration de sous-squences (ceci permet une Scalabilit temporelle que nous tudierons plus tard dans ce mmoire)

Ces technologies, ainsi que plusieurs autres permettent au format AVC/H.264 de dpasser les standards prcdents en termes de qualit dans une grande varit de circonstances et dans une grande varit d'environnements d'application. Cela apporte un nouveau standard en termes de qualit de diffusion. On remarque que le format AVC/H.264 produit des fichiers dont le poids est infrieur une vido MPEG-2, en obtenant la mme qualit avec un Bitrate diminu de moiti, voire plus. Comparons 2 formats utiliss en utilisation commerciale ; Prenons un DVD par exemple, celui-ci contient plusieurs fichiers Vido encods en MPEG-2 en 720x576 pixels (576p) La particularit du DVD est de concatner la totalit du film en plusieurs fichiers de 1 Go, et ces fichiers sont dnomms en .VOB. Cela explique pourquoi lorsque lon visionne un DVD, il peut y avoir une lgre coupure de limage pendant un bref instant. Cela est d au changement de VOB pendant la lecture. Le DVD existant depuis 1995, et les ordinateurs tant limits lpoque, il a fallu trouver une astuce pour rduire la charge du processeur lors de la dcompression des films. Depuis, le processeur ne dcompresse plus le MPEG-2, la carte graphique soccupe de cette tche. Un VOB correspond environ 30 minutes de vido, cela est approximatif car dpendant de la qualit vise par le studio responsable de la production du DVD. De plus, la dure maximale va dpendre de la technologie de compression utilise (Compression dbit constant ou variable) Ce principe est applicable tous les formats de vido et tous leurs supports. Donc en MPEG-2 ,576p : 1Go 30minutes (MPEG-2 : entre 1 Mbit/s et 15 Mbit/s en dfinition standard (SD : 720 x 576 pixels en PAL))

Sur un Blu-ray o le format AVC/H.264 est utilis, il ny a quun seul fichier pour la globalit du film. Cela ne produit pas de coupure pendant la lecture, mais ncessite un PC relativement puissant ou un matriel de dcompression ddi (lecteur Blu-ray de salon, carte de dcompression HD), aussi du fait de sa plus grande compression, donc complexit. Par contre, en AVC/H.264 576p 3Mb/s est recommand AVCHD : entre 5 et 24 Mbit/s en 720p et 1080p Un film H.264 qualit Blu-ray en 1080p peut peser jusqu 35Go ! Il est difficile pour ce format de donner une valeur de rfrence pour 30minutes, cela varie en fonction du matriel de captation ou du logiciel utilis. Toutefois, il faut nuancer ces valeurs, car le H.264 utilise la plupart du temps un encodage de type Variable. Les chiffres donns ne sont que des moyennes permettant dafficher une marge suffisante pour permettre aux CODEC de travailler sur le flux vido de manire optimale. Les images ne ncessitant pas du dbit maximum seront bien sr encodes un dbit moindre, permettant ainsi davoir un fichier HD avec un poids infrieur au 5,2Go ncessaire un fichier d1h en 6Mb/s

Philippe Gourgand Licence CPTIC - 2010

13

Concrtement, lors dun encodage dune vido dun format vers celui-ci, le CODEC va analyser la vido source. Lors de cette opration le logiciel va analyser image par image les lments (objets) apparents ainsi que leurs trajectoires, mais aussi les couleurs des images ainsi que laspect de limage sil sagit dun film en 16/9 ou 4/3, ou encore au format cinma anamorphos (cinmascope, Panavision,)

Ensuite, lopration de transcodage dbute, le CODEC va, en fonction de lanalyse, compresser ces images laide de MacroBloc ceux-ci sont des blocs de Pixel de diffrentes tailles, Ceux-ci tant gnralement dsigns ainsi : (1616, 168, 816, 88, 84, 48, 44) Plus leur taille sera petite, plus leur prcision sera proche de loriginale. La taille de ces blocs est dfinie lavance par lanalyse de leurs emplacements sur limage. En effet, une zone contenant du mouvement sera dfinie par des MacroBloc de plus petite taille pouvant ainsi reproduire ce mouvement de manire plus prcise. Par diffrence, une zone ayant peu, ou pas du tout de mouvement sera dfinie par des MacroBloc plus gros donc moins prcis.

Une fois cette opration de transcodage termine le logiciel va recoller les flux Vido et Audio dans le fichier conteneur, on dit quil effectue un multiplexage. Lors du transcodage, le logiciel a, nous lavons dit, rencod la vido, et fait de mme avec la ou les diffrentes pistes son. Car un format comme lAVC/H.264 peut, au sein du conteneur supporter diffrents format audio. Exemple : un Blu-ray contient au minimum 2 pistes, la VO et la VF.

(Schma simplifi du processus dencodage et de dcodage)

Philippe Gourgand Licence CPTIC - 2010

14

Comme nous lavons vu prcdemment, un transcodage peut induire une perte de donnes, mais certains formats audio dit lossless (sans perte) permettent de bnficier dun son de grande qualit. Une fois multiplex, le fichier peut tre lu condition de possder un logiciel pouvant dcompresser la vido ou tout autre appareil comme un tlphone compatible ou un lecteur de salon. A noter, quil existe aussi des formats vido sans perte, dont principalement le Motion JPEG 2000, qui sera utilis plus loin dans ce mmoire.

La contrepartie, est que le format AVC/H.264 peut, dans certaines conditions ncessitant une qualit maximale, tre assez complexe dcompresser et donc visualiser. Ceci interdit la lecture de film sur des ordinateurs peu puissants comme les Netbook. La notion de complexit, veut dire que pour dcoder le ou les flux, le traitement ncessitera de la part du processeur un apport de puissance bien suprieur. Toutefois, il existe une parade : les Cartes Graphiques ou GPU (Graphic Processor Unit). Celles-ci deviennent suffisamment puissantes pour dcoder en partie ou totalement les flux vidos. Cela permet de laisser le processeur libre pour dautres oprations. On appelle cela le DXVA (DirectX Video Acceleration) Certains Codec (propritaires) AVC/H.264 ont comme avantage dtre pleinement compatibles avec cette technologie. Certains Netbook plus avancs possdent un GPU plus puissant, pouvant dcompresser des flux HD. Mais cela est souvent un argument marketing. Toutefois, pour une utilisation Internet, les fichiers sont taills pour le streaming, donc de qualit visuelle infrieure. Le problme de complexit ne sapplique pas. La problmatique principale devient alors la Bande Passante Il devient ncessaire davoir accs une connexion Internet haut dbit pour bnficier de laffichage de film en streaming. (Nous parlons ici de streaming, nous naborderons pas lpineux problme du streaming illgal.) Le streaming a lavantage de diffuser des fichiers de qualit infrieure, leur poids est plus faible donc plus facile transporter, tlcharger. Un avantage certain pour les personnes qui ne veulent pas tlcharger un fichier complet DVD ou HD. Lordinateur a toujours le rle de la dcompression, mais la complexit tant moindre, son travail est facilit. Il est possible lheure actuelle de visionner certaines vidos encodes dans ce format laide dun Smartphone, par exemple. Toutefois, vous tes tributaire de la technologie Flash de lditeur Adobe, car celle-ci a pour rle dacheminer le flux vido jusqu votre ordinateur.

Philippe Gourgand Licence CPTIC - 2010

15

2.1.1.1 Profils On appelle Profils un ensemble doutils, principalement des algorithmes et des process lis au codage et au dcodage de vido. Ces outils sont autant dimplmentations quil existe de technologies doptimisation dans le h.264, chaque profil est dfini en fonction des technologies supportes ou non. Un logiciel dencodage, a la capacit dtre flexible sur ce point, puisquil va en fonction des rglages dfinis par lutilisateur, slectionner le bon profil, permettant ainsi au dcodeur dadapter son processus de dcodage par rapport au mode de codage pralablement dfini. Il est donc dfini lors du processus de transcodage par le logiciel, toutefois il est possible dinfluer manuellement sur ces rglages mais cela reste rserv aux utilisateurs expriments. Cest aussi un moyen de normer les diffrents fichiers, ceci permettant davoir une uniformisation des fichiers malgr leurs nombreux profils. Tout fichier possdera un Profil, le plus gnralement le profil Main le plus standard Le profil Baseline et extended sont utiliss pour le streaming Le Profil High est utilis pour les fichiers HD et ncessitant une haute qualit. Le Profil Intra est utilis pour les fichiers produits par les camras de type professionnel, il permet ldition des fichiers HD ou SD dans les logiciels de montage vido professionnel.

(Schma des 3 Profils les plus utiliss et les plus courants) Ce schma prsente les principales diffrences entre les profils, prsentant leurs technologies et possibilits
16

Philippe Gourgand Licence CPTIC - 2010

Certains Profils ont plusieurs dclinaisons particulirement le High et le Intra Les diffrences sont souvent minimes mais apportent une ou deux amliorations et optimisations, qui seront bienvenues pour un usage professionnel et commercial.

(Schma des profils utiliss par la plupart des logiciels dencodage professionnels et amateur) Ce schma apporte un complment dinformation quant la diffrenciation des sous profils Main et High

Philippe Gourgand Licence CPTIC - 2010

17

(Schma des Profils utiliss par les studios de Production pour le montage (Intra) et pour une utilisation commerciale (High)) Ce schma prsente les diffrenciations entre le profil Main et les profils Intra utilis en Production !
18

Philippe Gourgand Licence CPTIC - 2010

2.1.1.2 Levels (Niveaux) Nous lavons dj abord dans les notions, mais le niveau dun fichier est un lment trs important prendre en compte. Cette Valeur, est dtermine lors de lencodage du fichier vido, et est en rapport avec les diffrents lments qui composent le fichier, plus particulirement son flux vido : sa rsolution, son dbit (Bitrate) et surtout son profil. Cette valeur va de 1 5.1 voire dans certains cas, une valeur plus importante allant jusqu 5.4. Celle-ci se trouve dans de rares logiciels spcialiss permettant ldition de Master 2 K ou 4 K pour le Cinma et ldition de DVD et Blu-ray. Elle indique au logiciel de dcompression les ressources machine ncessaires pour dcompresser la vido. Plus son profil est lev, et plus sa dcompression va requrir de ressources.

(Schma prsentant des exemples de profils et niveaux en fonction de la rsolution de limage) Un profil de niveau 1 par exemple ne pourra sappliquer qu une vido de 12896 pixels a 30images/s Alors quun niveau 3 ne sapplique que pour les vidos de 720576 pixels 25images/s (Qualit DVD) Vous laurez compris pour de la Haute dfinition, un Blu-ray par exemple doit avoir un niveau plus lev ; un niveau 4 est ncessaire, car cest partir de ce niveau quun fichier est capable de possder une rsolution aussi importante.

Philippe Gourgand Licence CPTIC - 2010

19

Max macroblocks Level per second 1 1b 1.1 1.2 1.3 2 2.1 1,485 1,485 3 6 11,88 11,88 19,8 per frame 99 99 396 396 396 396 792 BP, XP, MP (kbit/s) 64 128 192 384 768 2 4

Max video bit rate (VCL) HiP (kbit/s) 80 160 240 480 960 2,5 5 Hi10P (kbit/s) 192 384 576 1,152 2,304 6 12 Hi422P, Hi444PP (kbit/s) 256 512 768 1,536 3,072 8 16

Examples for high resolution @ frame rate (max stored frames) 12896@30.9 (8) 176144@15.0 (4) 12896@30.9 (8) 176144@15.0 (4) 176144@30.3 (9) 320240@10.0 (3) 352288@7.5 (2) 320240@20.0 (7) 352288@15.2 (6) 320240@36.0 (7) 352288@30.0 (6) 320240@36.0 (7) 352288@30.0 (6) 352480@30.0 (7) 352576@25.0 (6) 352480@30.7(10) 352576@25.6 (7) 720480@15.0 (6) 720576@12.5 (5) 352480@61.4 (12) 352576@51.1 (10) 720480@30.0 (6) 720576@25.0 (5) 720480@80.0 (13) 720576@66.7 (11) 1280720@30.0 (5) 1,280720@60.0 (5) 1,2801,024@42.2 (4) 1,280720@68.3 (9) 1,9201,080@30.1 (4) 2,0481,024@30.0 (4) 1,280720@68.3 (9) 1,9201,080@30.1 (4) 2,0481,024@30.0 (4) 1,9201,080@64.0 (4) 2,0481,080@60.0 (4) 1,9201,080@72.3 (13) 2,0481,024@72.0 (13) 2,0481,080@67.8 (12) 2,5601,920@30.7 (5) 3,6801,536@26.7 (5) 1,9201,080@120.5 (16) 4,0962,048@30.0 (5) 4,0962,304@26.7 (5)

2.2

20,25

1,62

12

16

40,5

1,62

10

12,5

30

40

3.1 3.2 4

108 216 245,76

3,6 5,12 8,192

14 20 20

17,5 25 25

42 60 60

56 80 80

4.1 4.2

245,76 522,24

8,192 8,704

50 50

62,5 62,5

150 150

200 200

589,824

22,08

135

168,75

405

540

5.1

983,04

36,864

240

300

720

960

Philippe Gourgand Licence CPTIC - 2010

20

2.1.2 Apports et Etude Comparative Tout dabord, ce format apporte un gain de place indniable ; un film encod en AVC/H.264 pse beaucoup moins de Megaoctet sur un Disque Dur, en opposition au mme film encod dans un format brut de production ou un autre format comme le MPEG-2 voire mme son prdcesseur le MPEG-4, encore trs utilis aujourdhui. En termes de technique pure, ce format apporte un plus grand respect des chrominances de limage, une meilleure prcision et compensation du mouvement. Cest principalement pour cela que lindustrie du cinma a choisi ce format pour les films Blu-ray ; ce gain de place permet de mettre sur un seul disque le film en Haute dfinition, les pistes sons, et diffrents bonus. La meilleure manire pour moi de vous dmontrer les apports de ce format, est de vous prsenter un comparatif visuel sur une vido en Haute Dfinition, ici le Full HD 1080p. Nous allons comparer le rendu dun film (un court extrait) selon diffrents critres : - Qualit visuelle psychologique - Pixellisation - Poids du fichier - Charge du processeur lors de la dcompression Nous allons slectionner un extrait de film, ou plutt une bande annonce dans laquelle, nous aurons des squences ayant des mouvements rapides mais aussi peu de mouvement. Pour que ce comparatif soit reprsentatif, toutes les vidos seront encodes sur le mme ordinateur. (Les temps de travail pouvant varier en fonction de la configuration matriel, dun ordinateur un autre.) La bande annonce retenue est celle du film Scott Pilgrim VS the world Lavantage de cet extrait, est quil est assez court (environ 2minutes), quil est compos la fois de scnes daction trs colores avec beaucoup de mouvements ainsi que des passages dtaills plus lents. Les images utilises, reprsentent les acteurs Michael Cera, Satya Bhabha et Mary Elizabeth Winstead. Cette Bande annonce a t rcupre sur un site internet, www.HD-trailers.com. Elle est au format Full HD soit 1920x1080. Lavantage dutiliser une vido de cette qualit permet davoir beaucoup plus de pixels que sur une Vido qualit DVD en 576p (720x576). Lors dun comparatif de qualit, cela permet de voir beaucoup plus facilement lil nu, les dfauts et artefacts visuels. Sa qualit visuelle est la mme quune version commerciale Blu-ray. Avant deffectuer ces tests, nous allons changer le format de cette vido, par un format brut, non compress. Le choix a t port sur le standard de projection du cinma numrique, le Motion JPEG 2000. Il sagit dun format de vido, utilisant le format JPEG, que tout le monde connait, car toutes les images sont dans ce format. Le MJPEG 2000, encode une vido en 25 ou 24, 97 images JPEG par seconde. Cela a pour avantage de ne perdre aucune information, de crer un fichier totalement parfait qualitativement, mais extrmement lourd (700Mo pour environ 2Minutes de films en HD)

Philippe Gourgand Licence CPTIC - 2010

21

Procdure de test :
Le fichier ainsi cr est import dans diffrents logiciels dencodage du march. Pour tre reprsentatif, nous allons utiliser des logiciels propritaires payants et dautres libres et gratuits. Jai gard les rglages par dfaut de ces logiciels. Nous pourrions utiliser des milliers de rglages pour affiner les fichiers finaux. Mais en utilisant les rglages de base, nous utilisons les paramtres utiliss par monsieur tout le monde.

Image de rfrence :
Au format JPEG 2000 1920x1080pixels

Poids 711Mo Dbit 39,4Mbits Constant Utilisation CPU 10%

Philippe Gourgand Licence CPTIC - 2010

22

Logiciel : AVS Video Converter


Transcodage MPEG-4 sans utilisation de B-frame :

4 Min de traitement Poids 67,7Mo Dbit 3,5Mb/s Variable Utilisation CPU : 5%

Transcodage MPEG-4 avec utilisation de B-frame :

7 Min de traitement Poids 67,6Mo Dbit 3,5Mb/s Variable Utilisation CPU : 5%

Transcodage H.264 :

8 Min de traitement Poids 26,6Mo Dbit 1,29Mb/s Variable Utilisation CPU : 13%

Philippe Gourgand Licence CPTIC - 2010

23

Logiciel : Main Concept reference


Transcodage MPEG 4 : 6 Min de traitement Poids 117Mo Dbit 6,2Mb/s Variable Utilisation CPU : 6%

Transcodage MPEG 2 HD : 4 Min de traitement Poids 118,7Mo Dbit 6Mb/s Constant Utilisation CPU : 8%

Transcodage VC-1 :

5 Min de traitement Poids 113,4Mo Dbit 6Mb/s Variable Utilisation CPU : 15%

Transcodage H.264 :

7 Min de traitement Poids 111Mo Dbit 6mb/s Constant Utilisation CPU : 10%

Philippe Gourgand Licence CPTIC - 2010

24

Logiciel : Adobe Media Encoder


Transcodage H.264 : 24 Min de traitement Poids 525,8Mo Dbit 28,5Mo Variable Utilisation CPU : 20%

Transcodage MPEG-2 HD :

6 Min de traitement Poids 351,7Mo Dbit 18,5 Variable Utilisation CPU : 7%

Transcodage WMV :

25 Min de traitement Poids 151,5Mo Dbit 8Mo Variable Utilisation CPU : 10%

Philippe Gourgand Licence CPTIC - 2010

25

Logiciel : MediaCoder
Transcodage x.264 :

6 Min de traitement Poids 22,8Mo Dbit 1,1 Mb/s Variable Utilisation CPU : 13%

On remarque tout de suite les disparits de poids, de temps de calcul et dutilisation du processeur de la machine. Ceci est principalement caus par la finalit du logiciel (Professionnel ou Grand public). Si le logiciel est de type professionnel son temps de traitement va souvent tre plus long, car les algorithmes de compression qui le composent sont plus mthodiques . Dans le cas de notre tude ci-dessus, le logiciel Adobe Media Encoder, est un logiciel Professionnel (il fait partie dun Workflow complet Adobe Production). En fonction de la complexit de la vido cela va entrainer un temps et un effort de calcul plus soutenus. De plus, le logiciel va normer le fichier final, cest--dire quil cre un fichier de type Broadcast prt tre diffus, en tant sr que le fichier soit respectueux de la norme, mais aussi de sa structure interne, ne causant ainsi pas dincompatibilits. Un logiciel nayant pas pour vocation dtre Broadcast aura une vocation plus grand public : transcodage de film de vacances, ou de fichiers destination dun baladeur par exemple, ou simplement publication sur Internet. La liste de ce type de logiciel est longue ; AVS vido Converter, MainConcept Reference, SUPER, Xilisoft vido coder, MediaCoder Ceux-ci ont un temps de traitement plus court, en moyenne, car les fichiers traits ont comme finalit dtre publis ou utiliss par lutilisateur dans un cadre familial. En effet ce dernier installe un de ces programmes souvent gratuit ou un cot drisoire, et importe dans celui-ci une liste de fichiers quil veut transcoder. Ce logiciel nayant pas pour vocation de faire de la qualit Broadcast les fichiers finaux ne sont que trop rarement norms , impliquant ainsi le plus souvent des incompatibilits avec certains autres logiciels de visionnage ou plateforme de publication en ligne. On peut aussi remarquer que la consommation de ressources processeur durant la lecture varie en fonction du logiciel utilis pour crer le fichier H.264. La consommation est dpendante de lalgorithme utilis pour le transcodage du fichier, mais aussi de divers paramtres comme son profil et son niveau, comme nous avons pu le voir prcdemment. Vous pouvez aussi noter les diffrences de rendu chromatique entre les diffrents formats !

Philippe Gourgand Licence CPTIC - 2010

26

2.1.3 : Technologies Evolutives de ce format 2.1.3.1 : Scalable Video Coding (SVC) Il sagit du nom donn une extension du format H.264 dveloppe conjointement par UIT-T et l'ISO. Les deux groupes ont cr le Joint Video Team (JVT) pour dvelopper la norme H.264, ou MPEG-4 AVC (ITU-T Rec. H.264 | ISO/IEC 14496-10 AVC). En octobre 2003, le groupe Moving Picture Experts Group (MPEG) lance un appel la communaut scientifique ( Call for Proposals on SVC Technology ). Quatorze projets, dont douze bass sur la compression par ondelettes, sont proposs. Les deux propositions restantes tant des extensions de H.264/MPEG-4 AVC. L'une d'elle, propose par l'quipe image du Heinrich-Hertz-Institut (HHI) est choisie par MPEG comme point de dpart de son projet de standardisation de SVC. En janvier 2005, les groupes MPEG et Video Coding Experts Group (VCEG) se sont entendus pour finaliser le projet SVC comme un amendement de leur standard H.264/MPEG-4 AVC. L'objectif de SVC est d'offrir un contenu chelonnable, dit Scalable, c'est--dire que le contenu peut tre encod une fois, et offrir ensuite diffrents paliers de qualit en utilisant diffrents dbits. En Novembre 2008, Google a lanc son nouveau service "Gmail Video chat" qui utilise un codec H.264/SVC. C'est probablement le premier service utiliser cette norme pour des applications "grand public". Le CODEC SVC ncessite lutilisation de plusieurs couches Layers , chaque couche va tre encode diffrents dbits, celles-ci sont runies dans un seul et mme fichier. Lors du dcodage, le lecteur va en fonction de plusieurs paramtres dterminants, slectionner la ou les couches pouvant tre lues et surtout slectionner en priorit celle qui possde le plus fort ratio Qualit/Poids, pour permettre lutilisateur davoir la meilleure exprience possible. Ces diffrents paramtres sont : - La vitesse de Connexion internet pour une lecture en Streaming. - La puissance de dcodage de la machine ou de lappareil mobile qui effectue la dcompression. - La rsolution maximale de lcran. Le logiciel charg de la dcompression va automatiquement adapter le dcodage en fonction de ces paramtres, et peut mme le faire la vole. Exemple, vous visionnez un film en streaming, et au mme moment un membre de la famille commence le tlchargement dun fichier de grande taille. Automatiquement la qualit de la vido va diminuer, pour adapter son Bitrate en fonction de la bande passante disponible sur votre ligne.

Philippe Gourgand Licence CPTIC - 2010

27

Autre exemple, vous tlchargez un film encod en SVC et le donnez un ami, celui-ci na srement pas le mme matriel que vous (ordinateur, tlvision, lecteur). Or pendant la lecture le logiciel va adapter le fichier son cran plus grand que le vtre par exemple en utilisant le layer FullHD 1080p alors que vous utilisiez le layer 720p. Ceci peut tre applicable toutes les situations, le fichier ne peut plus tre pris en dfaut. Plus de cas o votre PC nest pas assez puissant pour dcompresser un flux. Hypothtiquement, le fichier peut tre lu depuis un tlphone mobile avec son petit cran ou depuis un Home Cinma FullHD 1080p voire plus ! Cela dpend du nombre de couches de Scalabilit utilises. Mais la question du poids du fichier ? On pourrait penser que de cumuler des couches implique le cumul du poids de toutes celles-ci. Or ce nest pas le cas. Grace des algorithmes, certaines zones de limage affiche sont partages toutes les couches. Mais certes le poids du fichier est bien sr suprieur un fichier simple , il est estim thoriquement a un surpoids de 40% au minimum. Il y a 3 grands Principes de Scalabilit : - Scalabilit temporelle : Chaque vido possde un nombre dimage par seconde diffrent, 24 au cinma, 25 la tlvision franaise, 29,97 aux Etats Unis Le concept de Scalabilit temporelle permet pour une mme vido de changer ce paramtre sans dtriorer le rendu visuel final de la vido. Cependant celle-ci pourra se retrouver acclre, comme passer de 24 images par seconde pour un film en salle et 25 images pour sa version DVD. Et croyez-moi, il y aura une diffrence au niveau du son, souvent plus aigu ! Scalabilit Spatiale : Ce concept permet de changer la taille, la rsolution dune vido. Lorsque vous agrandissez une vido dans un lecteur, vous ne faites que grossir les pixels de cette vido. On appelle ceci une interpolation de pixel , la preuve en est que si vous possdez une tlvision HD, et que vous visionnez un film DVD, vous verrez apparaitre des artefacts visuels. Les pixels ont t grossis ainsi que les dfauts. Or la Scalabilit permet grce certains algorithmes dencodage de passer dune rsolution moyenne une rsolution plus grande sans avoir une pareille dtrioration. Scalabilit Qualitative : Cela consiste rajouter des couches de dtails lors de lencodage du fichier, celle-ci ne seront lues que si cela est ncessaire, en augmentant le Bitrate de la bande passante dans le cas dun fichier lu en streaming. Microsoft a implment cette technologie au sein de sa technologie de diffusion Internet Silverlight . Dmonstration accessible cette adresse : http://www.iis.net/media/experiencesmoothstreaming Mais aussi en fonction de la rsolution de votre cran !

Philippe Gourgand Licence CPTIC - 2010

28

(Schma proprit de linstitut Fraunhofer, montrant visuellement les 3 types de Scalabilit) Ce schma montre de faon concrte, les 3 types de Scalabilit existantes. La modification de la cadence dimage, laugmentation ou la rduction de la rsolution dune vido, ainsi que laugmentation ou la baisse de qualit la vole.

(Schma reprsentant le cas o lon voulait crer diffrents fichiers pour diffrents types de bandes passantes) En temps normal il est recommand dencoder un fichier pour un usage spcifique, une version DVD et une version HD, ce que font par exemple les services de Video la demande (VOD) comme il en existe des dizaines en France. Il est de plus en plus possible de trouver des services proposant diffrentes versions de fichiers pour des supports tels que des consoles de jeux PSP de Sony et iPhone/iPod touch dApple.

Philippe Gourgand Licence CPTIC - 2010

29

(Schma de la technologie SVC et des connexions entre chaque Layer) Voici la situation qui pourrait se produire dans quelques annes, lorsque cette technologie se sera dveloppe. Un seul fichier lisible partout et surtout diffrents supports.

Cette technologie permettrait, vous lavez compris, de se passer du versionnement des fichiers ; un fichier global pouvant tre visionn partout la fois ! Cest la fois ce qui fait la force de ce format extrmement flexible, mais aussi sa faiblesse, car pour rendre ce fichier accessible au plus grand nombre, il sera surement ncessaire de tirer la qualit vers le bas. Cependant, la taille du fichier augmentant de manire significative, la question suivante peut tre pose : vaut-il mieux possder plusieurs fichiers pour tous les diffrents moyens de diffusion, ou uniformiser le tout ?

Philippe Gourgand Licence CPTIC - 2010

30

2.1.3.2: Multi-View Video Coding (MVC) Il sagit de la technologie utilise pour apporter le cinma en 3 Dimensions domicile et au cinma. Comme pour la technologie SVC, le MVC est une extension du H.264. Cette technologie a t cre pour le codage stroscopique (limage en relief) partir de 2 points de vue. Cette norme a t finalise en Juin 2009 et est depuis devenue le standard utilis dans les Blu-ray 3D qui commencent arriver dans le commerce. Lors de ltablissement de cette norme, un critre essentiel a t respect : la rtrocompatibilit avec le format H.264. En effet, le MVC est compos de 2 images mises cte cte , comme les 2 images que vos yeux peroivent, la gauche et la droite, votre cerveau restitue limage en 3 Dimensions. Dans notre cas, le logiciel de dcompression, va restituer cette 3D avec un peu daide. A lheure o jcris ce mmoire, il est quasiment impossible de regarder une vido en 3D avec nos seuls yeux ! Si vous tes alls au cinma rcemment voir un film en Relief stroscopiques, il vous a fallu des lunettes. Ces lunettes sont dites actives , les 2 verres sont polariss la lumire, cest--dire que le verre gauche ne va laisser filtrer que limage gauche. Et inversement pour limage droite. Mais une vido est une succession de 24 images pour le cinma, 25, 30 voir bien plus pour le reste. (Informatique, jeux) Pour crer cette impression de relief les lunettes vont chacune leur tour occulter limage droite puis limage gauche. A trs haute vitesse bien entendu ! Au cinma, cela se produira donc 24 fois par seconde, et comme chaque image possde 2 points de vue, un film 3D au cinma doit afficher 48 images par seconde. La stroscopie ne sattaque pas exclusivement au cinma mais aussi au domaine du jeu vido, dans ce cas les contraintes techniques sont plus lourdes, un jeu ne se contente pas dafficher 25 images par seconde, et comme limage est gnre par un cran il est estim que pour avoir une image fluide il est ncessaire de produire au minimum 30 images par secondes dit FPS (Frame Per Second) soit au minimum 60 Fps du fait de la 3D. Pour en revenir au format MVC, celui-ci est capable dafficher jusqu 3 points de vue de la mme image, En utilisant 2 de ces images nous obtenons un rendu stroscopique mais si nous utilisons ces 3 images nous obtenons un rendu dit en 3 dimensions, une ralit virtuelle. Pour crer un fichier en MVC, il est donc ncessaire dutiliser une camra stroscopiques avec 2 ou 3 objectifs, celles-ci sont pour lheure utilises dans lindustrie du cinma exclusivement. Ensuite, il faut utiliser un logiciel dencodage qui va utiliser les algorithmes de ce format pour convertir les 2 images en fichier pouvant tre visionn par lutilisateur.

Philippe Gourgand Licence CPTIC - 2010

31

Il existe 2 mthodes de positionnement des images : La mthode squentielle (Sequential)

Les images sont ici prsents une une, la gauche puis la droite. Les lunettes vont soccuper docculter les images qui ne correspondent pas. Lavantage de cette mthode est que chaque image arrive dans sa rsolution maximale Mthode cte cte (Side-by-Side)

Les images arrivent ici cte cte, le logiciel de dcompression va se charger de nafficher quune image, en runissant les 2 images laide des lunettes. Linconvnient est que pour une vido dune rsolution donne, les images sont ici cte cte, donc lors du visionnage on perd 50% de la taille de limage.

Cette technologie napporte pas vraiment de rvolution mais permet cependant dapporter la 3D stroscopique. Mais pour le moment le port obligatoire de lunettes et lachat de matriels compatibles en sont les principaux freins.

Le problme du port de lunettes a de fortes chances dtre corrig, certains acteurs du march travaillent sur des crans 3 dimensions ne ncessitant pas de lunettes, et dautres comme Disney travaillent sur de nouveaux algorithmes permettant de rduire linconfort que certaines personnes ressentent pendant le visionnage de film en relief.

Il sera intressant de suivre les volutions de cette technologie, car la 3D sera un jour dans nos foyers.

Philippe Gourgand Licence CPTIC - 2010

32

3- Solutions Alternatives : Formats Propritaires et Open-source


3.1 VC-1 (Format Propritaire)
Ce format a t le premier format utilis par le dfunt HD-DVD et les Blu-ray. Il a t dvelopp par Microsoft. Il sagit de lvolution du format Windows Media Vido 9 (WMV) et Windows Media Audio (WMA). Ces deux formats sont prsents nativement dans les systmes dexploitation Windows. Au dpart mis sur un mme pied dgalit avec le codec H.264, et profitant de la renomme de Microsoft. Il a donc t utilis dans un premier temps.

Mme si le VC-1 est encore utilis, le H264 a fini par simposer, car il est plus performant et dispose dun taux de compression plus lev pour une utilisation moins lourde du CPU. En effet, le VC-1 est de moins en moins utilis dans les supports commerciaux, au bnfice du H.264. Comme on peut le voir sur ce tableau comparatif, les caractristiques techniques sont assez semblables, mais le format de chrominance cest--dire le respect des couleurs dorigine de ce format noffre pas les mmes rglages. Le VC-1 naccepte que le 4:2:0 or lindustrie du cinma utilise au minimum le 4:2:2. Autre inconvnient, son poids pour un fichier de qualit DVD soit 720x576 le dbit moyen est de 4Mb/s.

Philippe Gourgand Licence CPTIC - 2010

33

Et surtout, il ne dispose pas des technologies de codage entropique. Ce format nest pas abandonn mais il nest pas destin voluer lheure actuelle. Voici un aperu de ce que donne le VC-1 en terme de rendu dune image contraste. Aperu VC-1 Profil Main :

Philippe Gourgand Licence CPTIC - 2010

34

3.2 X.264 (CODEC Alternatif)

Vous laurez not, le nom de ce CODEC est assez proche du format H.264. Cest tout fait normal, il sagit de son pendant Open-Source, celui-ci est bas sur une bibliothque libre sous licence GNU, issu dun projet du groupement VideoLAN en 2008. Ce nest pas proprement parler un format diffrent, mais un CODEC diffrent. Il permet dencoder des vidos dans le format H.264. Il possde les mmes spcificits que le codec H.264. Toutefois tant libre, il nest pas soumis aux cots de la licence dexploitation des brevets H.264, lui permettant ainsi dtre implment dans diffrents logiciels gratuits, offrant ainsi au grand public de pouvoir raliser des encodages H.264. Ce format est trs souvent prsent dans les fichier Matroska (.MKV) ce sont des transcodages de film en qualit Blu-ray H.264 ayant des dbit de 30Mb/s en moyenne. Le codec x.264 est utilis pour transcoder ces fichiers, pour les allger , leur permettant dtre plus facilement diffusables ! Celui-ci tant souvent utilis pour le piratage de film, il est malheureusement associ cette pratique. Mettons ici de ct laspect illgal de ce process ; le codec est assez performant puisquil permet de crer des fichiers HD en 720p denviron 4 6Go ou des fichiers 1080p denviron 7 9Go au lieu des 30 35Go du fichier dorigine prsent sur le Blu-ray, autorisant ainsi un utilisateur publier et diffuser sur internet ces fichiers de qualit semblable et les rendre accessibles au plus grand nombre et gratuitement.

Ce codec est prsent dans divers programmes souvent gratuits mais pointus, ceux-ci sont souvent utilisables en ligne de commande cest--dire sans interface graphique, donc il est ncessaire de passer par des commandes souvent difficiles pour les nophytes ! Cependant, il existe un dfaut. Il arrive souvent que certains fichiers .MKV ayant t encods en x.264 soient dfectueux : en effet il nest pas rare de rcuprer un fichier qui pendant sa dcompression va rencontrer quelques problmes de dcomposition, ou simplement de lourdeur. Ces fichiers sont toujours soumis au besoin de puissance de certaines machines, et certaines scnes peuvent tre plus complexes dcoder du fait de lutilisation de dbit Variable fortes amplitudes. De par mon exprience, je nai jamais pu visionner un fichier sans saccade ou sans apparition dartefacts visuels, de la mme qualit que le fichier dorigine dont il est issu.

Philippe Gourgand Licence CPTIC - 2010

35

Aperu fichier encod avec x264

Philippe Gourgand Licence CPTIC - 2010

36

Un Contexte conomique et technologique:


A lheure du lancement de la technologie HTML 5, cest--dire la dernire version du langage principal du Web, une bataille fait rage pour dfinir de nouveaux standards de vido sur internet. Cette nouvelle version apporte de nombreuses innovations, dont UNE nous intresse en particulier ; La Balise Vido. Les balises permettent dajouter un lment dans une page internet. Celles-ci permettront dintgrer directement une vido dans une page. Cette vido sera dcompresse par les CODEC prsents dans la machine (PC, MAC, tlphone.) La norme HTML actuelle ne permet lintgration dune vido quen passant par un visualisateur, de type Flash (Adobe) ou Silverlight (Microsoft) si lon veut que tout le monde puisse la lire. Chaque personne voulant lire une vido, doit obligatoirement installer le logiciel Flash et/ou Silverlight sur son ordinateur et sur les lecteurs multimdia. Cette Balise Vido, est une grande rvolution dans le monde de linternet, puisquil devient plus simple de mettre en place des solutions de streaming. Le problme, est de trouver un format universel pour linternet, qui puisse tre visionn par tous les navigateurs, ce sont eux qui permettent le visionnage, en intgrant les diffrents CODEC ncessaires dans leur propre code. Alors, trois solutions se prsentent : - Un format de qualit et dj rpandu, mais propritaire et dont la licence dexploitation est couteuse : le AVC/H.264 - Un format moins rpandu, mais qui est libre et donc sans aucune licence dexploitation : le Ogg Theora - Une autre alternative, un format rendu libre par Google, le VP8 devenu : WebM

3.3 Ogg Theora (format open-source)


Il sagit dun format de compression vido dit ouvert ou open-source sans aucun brevet. Le Theora est dvelopp par la fondation xiph.org, ayant pour but de crer et promouvoir un ensemble de standards audiovisuels (son et vido) ouverts, dont Theora fournit la vido. Le Theora est dvelopp sous Licence BSD, et est fond sur le format VP3 dvelopp par la socit ON2 technologies. Cette dernire a cd ses brevets dposs pendant le dveloppement du VP3, pour une utilisation sans restriction de ces technologies, permettant chacun dutiliser le format Theora pour une utilisation prive et commerciale sans aucune restriction ! Il ne sagit pas dun MPEG Open-source, le format Theora utilise ses propres algorithmes et mthode dencodages. Son dveloppement avait pour but principal de concurrencer les formats MPEG-4 et ses dclinaisons (DivX et XviD), ainsi que le Windows Media Video et le Real Video. Celui-ci est rput de moindre qualit bas dbit compar au format AVC/H.264. Or, en utilisation Internet, il est recommand dutiliser des fichiers bas dbit pour ne pas saturer la bande passante. Il est ddi 100% un usage Internet, cest--dire au visionnement de vido en streaming sur des pages internet, et non tre exploit commercialement et dispos sur support physique Haute Dfinition.

Philippe Gourgand Licence CPTIC - 2010

37

Voici un comparatif visuel du mme fichier encod en H.264 et en Theora

Le mme fichier (Scott Pilgrim bande Annonce 1080p en Motion JPEG) a t encod avec le logiciel Gratuit Handbrake pour les fichiers H.264 et le programme FFmpeg2theora (en ligne de commande) pour le Theora

Temps de travail : - H.264 : 5minutes - Ogg Theora : 15 Minutes Le dbit est identique pour les 2 fichiers, 900Kbits. Un dbit volontairement bas pour de la Full HD, car nous pourrons plus facilement voir les diffrences l il nu. Limage slectionne affiche un certain contraste de couleur sur son fond avec plusieurs dgrads, ainsi que plusieurs niveaux de dtails complexes (vtements, visage et cheveux)

On remarque tout de suite un cart important du temps de travail ncessaire au transcodage, preuve que les algorithmes du format Theora ne sont pas aussi optimiss que celui du format AVC/H.264, qui lui est pourtant plus complexe.

On distingue trs clairement les diffrences au niveau de ces 3 images, le fait davoir utilis une vido en FullHD (1920x1080) a vraiment permis de faire ressortir les dfauts de limage. Les images sont ici affiches en taille relle, une rduction de ces images aurait induit une diffrence moins probante. Ce comparatif permet de diffrencier AVC/H.264 et Ogg Theora, au niveau qualitatif ; dbit gal le Theora est moins performant, il est plus long transcoder et son rendu visuel est bien infrieur celui du H.264 avec ou sans codage entropique CABAC.

Philippe Gourgand Licence CPTIC - 2010

38

H.264 Sans Codage CABAC

Philippe Gourgand Licence CPTIC - 2010

39

H.264 avec Codage Entropique CABAC

Philippe Gourgand Licence CPTIC - 2010

40

Ogg Theora

Philippe Gourgand Licence CPTIC - 2010

41

3.4 WebM (VP-8) (Format open-source)


Le format VP8, dvelopp par la socit ON2 Technologies, a t rachet par Google en Fvrier 2010. La firme a indiqu par la suite sa volont de vouloir librer ce format, en crant un nouveau format vido libre : le WebM. Ce dernier se base sur le format VP8 pour la vido et sur le format Ogg Vorbis pour la partie audio. Google a profit du contexte difficile actuel, li lacceptation de nouveaux formats de vido en streaming pour linternet, comme nous lavons abord prcdemment entre le AVC/H.164 et le Ogg Theora, et leur intgration native dans les pages internet dveloppes en HTML5. La licence de WebM, base sur la clbre licence BSD, avait t soigneusement tudie pour viter toute attaque sur le terrain de la proprit intellectuelle. Ainsi, tous ceux qui intenteraient des poursuites judiciaires ou mme un soutien une procdure judiciaire mettant en cause le VP8, se verraient retirer tous les droits d'utilisation du format. Il s'agit l d'une stratgie ingnieuse : en effet, dans ces conditions, il parait improbable qu'une socit attaque Google. YouTube, le clbre site de partage de vidos, supporte dj WebM (ce qui n'est pas trs tonnant, YouTube appartenant Google). DailyMotion, quant lui, supporte Theora (OGG) et Vimeo, le H.264, mais ils passeront srement bientt au WebM. Pour bnficier du WebM, il faut disposer d'un navigateur compatible, activer la version HTML5 sur YouTube, par exemple. Pour Windows, il faut simplement tlcharger un plugin pour DirectShow, l'API qui gre la vido dans Windows, notamment utilise par Windows Media Player, pour pouvoir encoder et lire des vidos WebM. Le lecteur multimdia VLC est lui aussi capable de lire le format WebM depuis sa version 1.1. Le VP8 est reconnu suprieur au format Theora (qui lui-mme est une amlioration du VP3, le prdcesseur du VP8) Le principal dveloppeur du CODEC alternatif x264, a mis des critiques lencontre du VP8 de Google, selon-lui le VP8 ne disposerait pas dalgorithmes avancs qui eux, sont prsents dans le AVC/H.264, comme le codage arithmtique adaptatif. Ceci ne permettant pas au VP8 dobtenir des ratios de compression aussi fort que le H.264. Aussi, le VP8 tant jeune il nest pas encore assez optimis, les processus dencodage et de dcodage sont actuellement assez lents. Et surtout, le dcodage matriel nest pas encore disponible. Toutefois, on peut esprer une rsolution de ce problme moyen terme, au vu des nombreux acteurs du march soutenant ce codec libre, et les investissements faits par Google.

Philippe Gourgand Licence CPTIC - 2010

42

Voici un petit comparatif visuel entre le VP8 et lAVC/H.264

Ces images sont tires du site www.streamingmedia.com, et de larticle "First Look: H.264 and VP8 Compared

Philippe Gourgand Licence CPTIC - 2010

43

Conclusion et Prospective:
Tout au long de mon dveloppement, jai voulu dmontrer que le format vido AVC/H.264 deviendra le format universel de captation, de production et de diffusion, et pourra sadapter tous les usages prsents et futurs.

Ce format sera-t-il rellement la solution aux attentes des utilisateurs (particuliers et professionnels), en terme de demandes de Qualit Audiovisuelle et dAccessibilit Universelle ?
Au travers de ce mmoire, nous avons pu mettre en vidence plusieurs contradictions dans cet univers de vido Professionnel et Grand Public. En premier lieu, lopposition flagrante du libre et du propritaire, lun gratuit lautre non. Mais leurs possibilits ne sont pas les mmes. Idologiquement, le choix se fait sur lun ou lautre des canaux de diffusion (Internet ou Commercial) LInternet tant un endroit nayant pas ou peu de contrle et o certains voudraient lemploi de technologie 100% libre, il devient naturel que le libre soit galvanis par cette dynamique communautaire qui va de pair avec le libre. Cependant, nous lavons dmontr, le format libre concurrent nest pas aussi efficace que son quivalent propritaire ! Un format libre est dvelopp par une communaut dutilisateurs souvent experts dans leur domaine ; un format propritaire est dvelopp dans un laboratoire danalyse de grands instituts de recherche. Souvent lexpertise est bien meilleure et le mode de dveloppement est plus efficace, ainsi que les budgets de dveloppement. Je ne peux pas juger de la qualit du travail de ces communauts, cependant au rsultat final certaines technologies dveloppes ne peuvent supplanter un travail propritaire. Dans le cadre dun usage Internet, la diffrence est peu perceptible car les fichiers tant de taille et de rsolution plus rduite quun fichier commercial, les dfauts apparaissent peu ou pas. Enfin, nous allons rentrer dans le sujet qui fait dbat lheure actuelle, le gratuit et le payant. Internet est un formidable moyen de visionner des vidos, le streaming a pu apporter la capacit de visionner un film tous ceux qui ne peuvent tlcharger un fichier complet avec leur bande passante limite. Par consquent, les fichiers transmis en streaming se veulent lgers, et un encodage vido lger veut dire petit Bitrate, donc qualit amoindrie. On peut opposer cela laspect commercial mais qui nest pas forcment diaboliser, car tout le monde achte des DVD, et se met peu peu squiper en lecteur Blu-ray, et bien sr si vous disposez dune tlvision compatible ! Ici, le fichier est taill pour avoir une qualit prmium, un son et une qualit visuelle proche ou identique au film sorti en salle. Le message envoy aux consommateurs est simple, sil veut de la qualit il doit acheter un fichier Haute Dfinition ; il existe certes une alternative avec les fichiers MKV contenant une vido au format H.264, mais ces fichiers sont trop souvent soumis des erreurs de dcompression, comme lapparition dartefacts visuels. Daprs moi, ils ne peuvent avoir une relle valeur pour le consommateur voulant une vraie exprience audiovisuelle !

Philippe Gourgand Licence CPTIC - 2010

44

La plante Internet se partage entre deux gants : Google et le consortium MPEG LA qui souhaitent tous les deux la plus grande part du march de la diffusion audiovisuelle dans le monde, tous supports confondus. MPEG LA est propritaire du format AVC/H.264 (objet central de cette tude) dj trs rpandu dans nos ordinateurs et sur nos sites Internet. Google, principal moteur de recherche sur Internet est propritaire de YouTube, le principal portail de diffusion vido sur Internet avec plus de 2 milliards de clips visionns quotidiennement. Google annonce aujourdhui la libration complte des droits sur la technologie du nouveau codec vido de On2 nomm VP8 en ouvrant son code source pour que nimporte quel programmeur puisse lutiliser. Ceci aura pour effet de le rendre gratuit lutilisation et on devrait voir apparaitre dici quelques mois des applications permettant dencoder dans ce nouveau format vido qui on a adjoint le format dj libre de droits Ogg Vorbis pour la partie audio. Ainsi est n le conteneur WebM. En face, le consortium MPEG LA renonce, jusqu fin 2015 faire payer systmatiquement des licences pour l'utilisation du format vido H.264 sur Internet. A partir de 2016, la redevance sera exige y compris pour l'encodage de vidos gratuites pour l'utilisateur, comme celles proposes sur YouTube ou DailyMotion. Toutefois, celui-ci a annonc la gratuit, pour toute la dure de vie de ce format, des droits pour toutes vidos publies sur internet, pour un usage 100% internet. Ces annonces sont lourdes de sens. Devant un conflit qui met en opposition des intrts financiers, technologiques et idologiques considrables, le W3C (World Wide Web Consortium, organisme de standardisation but non-lucratif, fond en octobre 1994, charg de promouvoir la compatibilit des technologies WWW) a refus de dsigner les codecs vido standards utiliser avec le HTML5, qui facilitent l'incrustation de vidos dans les pages web. Libre ainsi chaque diteur de navigateur de choisir les formats qu'il souhaite prendre en charge, et chaque diteur de sites web de choisir le ou les formats qu'il souhaite utiliser. Cette gratuit consentie par le consortium MPEG LA n'est pas vraiment un cadeau, plutt un pige qui se refermera sur le web et le logiciel libre en 2016, en favorisant par dfaut le conteneur WebM de Google. Les intrts de ces deux gants sont contradictoires dans le sens o Google vend un service complet valeur ajoute, alors que MPEG LA vend lusage (la licence) dune technologie dencodage qui sert de support des services valeur ajoute. Les cinq annes qui viennent seront dcisives pour le format AVC/H.264, et il y a fort parier que ce sont les partenaires comme Microsoft, Adobe, Mozilla, et des entreprise et services qui nexistent pas encore, qui feront voluer les stratgies actuelles. Mme si Google russit imposer son standard de diffusion, il est fort probable que le format AVC/H.264 ne disparaitra pas aux oubliettes de lhistoire Internet, mais deviendra le format de rfrence de la Vido la Demande (VoD), de la Tlvision Numrique Terrestre (TNT) et dautres mdia comme le tlphone ou les tablettes numriques, puisque le format H.264 est associ la notion de qualit visuelle et de fichiers respectant les normes de diffusion.

Philippe Gourgand Licence CPTIC - 2010

45

Table des matires


Remerciements.................................................................................................................................................... 1 Introduction : ....................................................................................................................................................... 3 Historique : ...................................................................................................................................................... 4 1 Description de la Vido Numrique et formats de diffusion :....................................................................... 5 1.1 Notions de Production et Diffusion ........................................................................................................... 5 1.2 Notion de CODEC ....................................................................................................................................... 6 La fonction Codage (Compression): .................................................................................................... 6 La fonction Dcodage (Dcompression): ............................................................................................ 6 La fonction Transcodage (changement de CODEC) : ........................................................................... 7

1.3 Notions de structure dun fichier Vido .................................................................................................... 9 1.4 Notion de dbit de donnes (Bitrate) ..................................................................................................... 11 2 - Etude Avance du Format vido AVC/H.264................................................................................................ 12 2.1 Prsentation Technologique ................................................................................................................... 12 2.1.1 Technologie ...................................................................................................................................... 12 2.1.2 Apports et Etude Comparative ......................................................................................................... 21 2.1.3 : Technologies Evolutives de ce format ............................................................................................ 27 3- Solutions Alternatives : Formats Propritaires et Open-source .................................................................. 33 3.1 VC-1 (Format Propritaire) ................................................................................................................... 33 3.2 X.264 (CODEC Alternatif) ...................................................................................................................... 35 Un Contexte conomique et technologique: ................................................................................................ 37 3.3 Ogg Theora (format open-source) ........................................................................................................ 37 Voici un comparatif visuel du mme fichier encod en H.264 et en Theora ............................................ 38 3.4 WebM (VP-8) (Format open-source) .................................................................................................... 42 Voici un petit comparatif visuel entre le VP8 et lAVC/H.264 ................................................................... 43 Conclusion et Prospective: ................................................................................................................................ 44 Annexes : ........................................................................................................................................................... 47 Lexique :......................................................................................................................................................... 47 Bibliographie :................................................................................................................................................ 50 Notes : ........................................................................................................................................................... 51

Philippe Gourgand Licence CPTIC - 2010

46

Annexes :
Lexique :

Artefacts visuels : cette terminologie dfinit une ou un ensemble daltrations de


laspect visuel dun lment ou une image. En vido cela correspond lapparition dlments mal dcomposs lors de la lecture entrainant lapparition de ces artefacts.

Bande Passante : dbit thorique ou disponible de transmission de donnes sur un


rseau informatique. Indique la capacit lectronique de transmission d'un signal, ou d'affichage d'une image, pour un ordinateur ou un matriel de projection (plus large est sa bande passante, plus l'image est dtaille et sa rsolution leve).

Bitrate : le dbit binaire est une mesure de la quantit de donnes numriques transmises par
unit de temps. Il est gnralement exprim en bits par seconde (bit/s, b/s ou bps). Constant Bitrate (CBR) est un terme anglais que l'on peut traduire en franais par : taux d'chantillonnage fixe , en opposition au variable Bitrate (VBR), qui peut se traduire en franais par : taux d'chantillonnage variable

Broadcast : pouvant se traduire par Diffuser , et caractrise, dans le milieu de la


technique vido ou radiophonique, un enregistrement audio ou vido qui respecte les normes de diffusion professionnelles, que ce soit au niveau de la qualit, du support, du niveau de contraste, etc ...

Chrominance : cela dsigne la partie de l'image vido correspondant l'information de


couleur. Il a t indiqu, pour la luminance, que l'information de couleur est fournie partir de 3 couleurs primaires : Red, Green et Blue, pour respectivement, le rouge, le vert et le bleu. Un signal vido tant compos d'une part d'information de luminance, il est ncessaire de disposer de deux informations de chrominance pour que les trois informations de couleur (correspondant aux trois couleurs primaires) puissent tre reconstitues.

Codage entropique : il sagit dune mthode de compression sans perte, ayant


pour but de transformer la reprsentation dune source de donnes pour sa compression et sa transmission sur un canal de diffusion. Ce codage utilise des statistiques sur la source pour construire un code. Le codage entropique est issu de la thorie de l'information, et traite de ces codes et de leurs proprits. L'information coder est reprsente par une variable alatoire, valeur dans un alphabet de taille finie.

CPU (Central Processing Unit): pouvant se traduire par Unit


centrale de traitement il sagit du Processeur, le composant de l'ordinateur qui excute les programmes informatiques.

Definition standard : Pour une vido de Qualit DVD, la dfinition standard


est de 720x576 pixel soit 576p. Pour une vido Haute dfinition, la dfinition standard est de 1280x720 pixels soit 720p. Pour la vraie haute dfinition dite FullHD , la dfinition standard est de 1920x1080 pixels soit 1080p. Les appellations 720 et 1080 font rfrence au nombre de pixels verticaux, pour la hauteur de limage. Alors que le p fait rfrence au terme progressive qui soppose au i de interlace (entrelac en franais), il sagit du mode daffichage dune vido sur un cran.

Philippe Gourgand Licence CPTIC - 2010

47

Downloading : pouvant se traduire par Tlchargement , En informatique, le


tlchargement est lopration de transmission dinformations (programmes, donnes, images, sons, vidos) dun ordinateur un autre via un canal de transmission, en gnral internet ou intranet. De nos jours, la notion de tlchargement est trs maladroitement associe par abus de langage, uniquement aux tlchargements de fichiers stocks sur disque dur, aprs un passage par la mmoire vive des ordinateurs.

DRM (Digital Right Management) : pouvant se traduire


par Gestion des Droits Numriques ayant pour objectif de contrler l'utilisation qui est faite des uvres numriques, par des mesures techniques de protection. Ces dispositifs peuvent s'appliquer tous types de supports numriques physiques (disques, DVD, Blu-ray, logiciels) ou de transmission (tldiffusion, services Internet) grce un systme d'accs conditionnel.

GPU (Graphic Processing Unit) : pouvant se traduire par


Processeur Graphique , cest un microprocesseur prsent sur les cartes graphiques au sein dun ordinateur ou dune console de jeux vido. Le processeur graphique se charge des oprations daffichage et de manipulation de donnes graphiques. Les processeurs des cartes graphiques modernes (en 2009) ont une structure hautement parallle qui les rend efficaces pour une large palette de tches graphiques comme le rendu 3D, en Direct3D, en OpenGL, la gestion de la mmoire vido, le traitement du signal vido, la dcompression Vido.

Luminance

: Un signal vido est habituellement compos de trois signaux correspondant

aux couleurs fondamentales qui sont notes : R pour le rouge G pour le vert (green en anglais) B pour le bleu

On peut par commodit dcomposer ce signal en trois autres composantes. La luminance est alors la partie du signal vido correspondant l'intensit lumineuse produite, soit le niveau entre le noir et le blanc. La couleur et l'intensit de cette couleur correspondent l'autre partie du signal, appeles respectivement chrominance et saturation.

Scalabilite : anglicisme dont la traduction propose par l'AFNOR serait "chelonnabilit".


Proprit d'un flux vido de permettre une transmission et un dcodage partiels un dbit voluant dans un intervalle donn et permettant la restitution d'une rsolution ou d'une qualit variables en fonction de ce dbit. Ceci s'effectue sans transcodage, le dbit total tant celui ncessaire la plus haute rsolution la plus haute qualit.

Streaming : pouvant se traduire par lecture en flux ou lecture en continu , dsigne un


principe utilis principalement pour l'envoi de contenu en direct (ou en lger diffr). Trs utilise sur Internet, cette technologie permet la lecture d'un flux audio ou vido (cas de la vido la demande) mesure qu'il est diffus. Elle s'oppose ainsi la diffusion par tlchargement de fichiers qui ncessite de rcuprer l'ensemble des donnes d'un morceau ou d'un extrait vido avant de pouvoir l'couter ou le regarder. Nanmoins la lecture en continu est, du point de vue thorique, un tlchargement car il y a un change de donnes brutes entre un client et un serveur, mais le stockage est provisoire et n'apparat pas directement sous forme de fichier sur le disque dur du destinataire.

Philippe Gourgand Licence CPTIC - 2010

48

Video a la Demande : est entendue comme la mise disposition des


programmes au consommateur final, sa demande et lheure de son choix, par tous rseaux de communications lectroniques et notamment, via le rseau Internet, par voie hertzienne terrestre, par cble, par satellite et par rseaux de tlcommunications, par tous procds de diffusion crypte, tels que streaming (diffusion linaire) ou downloading (tlchargement), et pour visualisation sur tout matriel de rception, par tout mode de scurisation, et ce, aprs paiement dun prix, pour une reprsentation dans le cadre du cercle de famille ainsi que dans les circuits ferms (cest dire dans une unit de lieu spcifique accessible au public, telles que les collectivits dans lesquels les usagers effectuent des sjours temporaires, htels et rsidences de tourisme, prisons, tablissements de sant, bureaux, armes, les bars, cafs, restaurants et les lieux accueillant du public de passage, notamment les boutiques, commerces, salles dattentes, etc.). Le consommateur final ne peut en aucun cas agir sur les images du programme, ni visionner ce programme sans sacquitter au pralable dun droit correspondant aux conditions commerciales fixes par loprateur en cas doffre payante, ni retransmettre le programme destination de tiers par quelque procd que ce soit. Dfinition valide par le Centre National de la Cinmatographie (CNC).

Workflow : pouvant se traduire par Flux de travaux . On appelle Workflow la modlisation


et la gestion informatique de l'ensemble des tches accomplir et des diffrents acteurs impliqus dans la ralisation d'un processus mtier (aussi appel processus oprationnel ou bien procdure d'entreprise) De faon plus pratique, le Workflow dcrit le circuit de validation, les tches accomplir entre les diffrents acteurs d'un processus, les dlais, les modes de validation, et fournit chacun des acteurs les informations ncessaires pour la ralisation de sa tche.

Philippe Gourgand Licence CPTIC - 2010

49

Bibliographie :
Ouvrages de rfrence :
The H.264 Advanced Video Compression Standard, Second Edition 2010 De Iain E. Richardson http://www.vcodex.com/h264mpeg4/index.html Biographie http://www4.rgu.ac.uk/eng/aboutus/page.cfm?pge=3284

Sites internet :
H.264 AVC http://www.vcodex.com/h264.html http://en.wikipedia.org/wiki/H.264/MPEG-4_AVC http://www.hdfever.fr/2009/03/22/le-h264-le-codec-le-plus-avance-au-monde/#installation SVC Site internet Camera Video - Forum http://www.cameravideo.net/forum/news-de-video/13724-h-264-svc-un-format-unir.html Site internet Fraunhofer Institut http://ip.hhi.de/imagecom_G1/savce/index.htm Article Wikipdia http://fr.wikipedia.org/wiki/Codage_vido_scalable Dossier France Telecom datant de 2006 http://www.orange.com/fr_FR/innovation/actus/thematique/tous_les_dossiers/att00006850/ddm_200605f r.pdf Application dune technologie SVC concurrente http://www.hdfever.fr/2010/03/05/smooth-streaming-silverlight-avc-svc-h264-youtube-sous-titre/ tutoriel http://www.eetimes.com/design/industrial-control/4017613/Tutorial-The-H-264-Scalable-Video-Codec-SVCoutils danalyse des fichier SVC - SVC Analyzer 2.0 http://www.svc-analyzer.com/index.php/svc-analyzer-20.html Ogg Theora: Site internet Gnraliste Ars Technica http://arstechnica.com/open-source/news/2010/02/ogg-theora-vs-h264-head-to-head-comparisons.ars Google WebM : Site Internet Le site du Zro http://www.siteduzero.com/news-62-36515-google-libere-le-codec-video-vp8.html Article Wikipdia http://fr.wikipedia.org/wiki/WebM Comparatif WebM & Theora http://www.fansub-streaming.eu/blog/test-webm-vs-theora.html Blog http://blog.nicolargo.com/2010/05/encodage-de-video-webm-en-ligne-de-commande.html

Philippe Gourgand Licence CPTIC - 2010

50

Notes :

Philippe Gourgand Licence CPTIC - 2010

51

Philippe Gourgand Licence CPTIC - 2010

52

Philippe Gourgand Licence CPTIC - 2010

53

Philippe Gourgand Etudiant en Licence Pro Conduite de Projet TIC dans les PME Salari chez UbicMedia SAS Europe Numriseur Passionn de vido et de cinma

Rsum : Au travers de ce mmoire, je vais vous montrer que le format vido Advanced Video Coding/H.264 (AVC/H.264 ou h.264) devient le format universel de captation, de production et de diffusion, et sadapte tous les usages prsents et futurs. Ce format est-il rellement la solution aux attentes des utilisateurs (particuliers et professionnels), en terme de demandes de Qualit Audiovisuelle et dAccessibilit Universelle ? Pour rpondre cette problmatique, nous devrons comprendre cette technologie, la resituer dans lensemble des formats vido numriques existants et ainsi pouvoir en mesurer limpact sur le futur.

Mots cls :
Video Compression: Il sagit de la mthode de compression de donnes, utilise pour rduire la quantit de donnes dun fichier vido (Video et Son). Le but est de trouver le meilleur rapport Poids/Qualit pour ne pas dnaturer une vido. Son principal intrt est de rduire le poids des fichiers, amliorant aussi la transmission dinformations. Encodage/transcodage: Le terme encodage signifie toute opration de codage dun objet en donnes informatiques. Le transcodage est lopration par laquelle on passe pour changer le format de codage dun media (vido et audio). Cela permet dadapter le format en fonction du support sur lequel il est, stock, transport et diffus. MPEG-4: Il sagit dune norme dobjets audiovisuels dfinie par le consortium Moving Picture Experts Group (MPEG). Cette norme dfinit des fichiers pour diffrents usages (internet, tlvision, jeux vido) AVC (Advanced Video Coding) - H.264: Il sagit dune norme de codage vido, ayant pour but damliorer lefficacit du codage vido par rapport dautres formats. Elle apporte aussi plusieurs technologies permettant un meilleur respect de la qualit dorigine. Dbit (Bitrate) : Le dbit est une mesure quantitative, permettant de mesurer les donnes numriques transmises en ko/s, Mo/s On peut aussi lappeler la bande passante . En vido, plus le dbit est lev et plus grande sera la qualit ! Scalabilit temporelle, spatiale, qualitative : Le terme Scalabilit est un anglicisme dsignant lextensibilit dun processus, dun rseau, dun systme. En vido, ce terme est utilis pour dsigner une opration permettant de modifier laspect visuel, la taille et la qualit. CODEC : Cette appellation vient de compression-dcompression , il sagit dun procd permettant la compression et la dcompression de donnes numriques. Il peut sagir dun outil matriel ou dans notre cas, dun logiciel.