Sie sind auf Seite 1von 14

Le langage XML (eXtended Markup Language) est un langage de format de document.

Il drive de SGML (Standard Generalized Markup Language) et HTML (HyperText Markup Language). Comme ces derniers, il s'agit d'un langage form de balises qui permet de structurer les documents. Le langage XML s'est impos comme le format standard pour les communications entre applications. Il est utilis dans la plupart des projets de publication sur le WEB ainsi que dans les bases de donnes.

Le langage XML (eXtended Markup Language) est un langage de format de document. Il drive de SGML (Standard Generalized Markup Language) et HTML (HyperText Markup Language). Comme ces derniers, il s'agit d'un langage form de balises qui permet de structurer les documents. Le langage XML s'est impos comme le format standard pour les communications entre applications. Il est utilis dans la plupart des projets de publication sur le WEB ainsi que dans les bases de donnes.

L'historique suivant retrace les grandes tapes qui ont conduit la naissance de XML: 1986 : Introduction de SGML par Charles Goldfarb. 1991 : Introduction de HTML par Tim Berners-Lee pour le WEB. 1998 : Publication par le W3C de la version 1.0 d'XML. 1999 : Redfinition de HTML 4.0 en XHTML travers XML. 2004 : Publication par le W3C de la version 1.1 de XML pour une mise jour des caractres spciaux en lien avec Unicode.

XML s'est impos comme un standard incontournable dans le monde de l'informatique. Il est aussi bien utilis pour stocker des documents que pour des changes de donnes. Ce succs est en grande partie du aux qualits de XML. Les caractristiques essentielles qui ont conduit ce dveloppement: Simplicit, universalit et extensibilit; Format texte avec gestion des caractres spciaux; Structuration forte; Sparation stricte entre contenu et prsentation; Modles de documents (DTD et Schmas XML); Modularit des modles; Validation du document par rapport au modle; Format libre; Nombreuses technologies dveloppes autour de XML;

XLink et Xpointer : Liens entre documents; XPath : Sous-ensemble d'un document; Xquery : Requtes de base de donnes; XSL : Transformation de documents; Schmas XML : Modles de documents.

La syntaxe de XML est relativement simple. Elle ncessite un effort trs modr pour son apprentissage. Elle est constitue de quelques rgles pour l'criture d'une entte et des balises pour structurer les donnes. Ces rgles sont trs similaires celles du langage HTML utilis pour les pages WEB mais elles sont en mme temps plus gnrales et plus strictes. Elles sont plus gnrales car les noms des balises sont libres. Elles sont aussi plus strictes car elles imposent qu' toute balise ouvrante corresponde une balise fermante.

Premier exemple:
Le langage XML est un format orient texte. Un document XML est simplement une suite de caractres respectant quelques rgles. Il peut tre stock dans un fichier et/ou manipul par des logiciel en utilisant un codage des caractres. Ce codage prcise comme traduire chaque caractre en une suite d'octets rellement stocks ou manipuls. On commence par donner un premier exemple de document XML comme il peut tre crit dans un fichier bibliographie.xml. Ce document reprsente une bibliographie de livres sur XML. Ce document contient une liste de livres avec pour chaque livre, le titre, l'auteur, l'anne de parution, le numro ISBN.

<?xml version="1.0" encoding="iso-8859-1"?> 1 <!-- Time-stamp: "bibliography.xml 3 Mar 2008 16:24:04" --> 2 <!DOCTYPE bibliography SYSTEM "bibliography.dtd" > 3 <bibliographie> 4 <livre num="Michard01" lang="fr"> 5 <titre>XML langage et applications</titre> <auteur>AlainMichard</auteur> <annee>2001</annee> <publier>Eyrolles</publier> <isbn>2-212-09206-7</isbn> </livre> <livre num="Zeldman03" lang="en"> <titre>Designing with web standards</titre> <auteur>Jeffrey Zeldman</auteur> <annee>2003</annee> <publier>New Riders</publier> <isbn>0-7357-1201-8</isbn> </livre> </bibliographie> 6

1- Entte XML avec la version 1.0 et l'encodage iso-8859-1 des caractres; 2- Commentaire dlimit par les chanes de caractres <!-- et -->; 3- Dclaration de DTD externe dans le fichier bibliography.dtd; 4- Balise ouvrante de l'lment racine bibliographie; 5- Balise ouvrante de l'lment livre avec deux attributs de noms num et lang et de valeurs Michard01 et fr; 6- Balise fermante de l'lment racine bibliographie.

Le XML impose des rgles de syntaxe trs spcifiques par rapport au Html. En outre, on retrouvera ces mmes rgles de syntaxe dans tous les langages drivs du XML comme le XHTML ou le WML par exemple. Le XML est un langage de balises [Markup Language]. Mais au contraire du Html o les balises sont dfinies, on peut inventer des balises, puisque le XML est eXtensible. Il faut donc crire soi-mme le nom des balises utilises. Il y a quelques rgles pour la composition des noms: Les noms peuvent contenir des lettres, des chiffres ou d'autres caractres. Les noms ne peuvent dbuter par un nombre ou un signe de ponctuation. Les noms ne peuvent commencer par les lettres xml (ou XML ou Xml...). Les noms ne peuvent contenir des espaces.

La longueur des noms est libre mais on conseille de rester raisonnable. On vitera certains signes qui pourraient selon les logiciels, prter confusion comme "-", ";", ".", "<", ">", etc. Les caractres spciaux pour nous francophones comme , , , , sont priori permis mais pourraient tre mal interprts par certains programmes. Les balises sont sensibles au majuscules et minuscules : La balise <Message> est diffrente de la balise <message>. La balise d'ouverture et la balise de fermeture doivent donc tre identiques. Ainsi par exemple ; <Message> ... </message> est incorrect et <message> ... </message> est correct.

Toute balise ouverte doit imprativement tre ferme. Fini les critures bcles du Html o l'on pouvait dans certains cas omettre la balise de fin comme pour le paragraphe <p> ou l'lment de liste <li>. Ainsi en Html, ce qui suit est affich correctement : <p> <ul> <li>Point 1 <li>Point 2 .. Le XML est beaucoup plus strict. On devrait avoir : <p> <ul> <li>Point 1</li> <li>Point 2</li> ..

Les balises doivent tre correctement imbriques. Le XML tant trs proccup par la structure des donnes, des balises mal imbriques sont des fautes graves de sens. Ainsi l'criture suivante est incorrecte car les balises ne sont pas bien imbriques : <parent><enfant>Ali</parent></enfant> L'criture correcte avec une bonne imbrication des lments est : <parent><enfant>Fatima</enfant></parent>

Les valeurs des attributs doivent toujours tre mises entre des guillemets. Le XML peut avoir (comme le Html) des attributs avec des valeurs. En XML, les valeurs des attributs doivent obligatoirement tre entre des guillemets, au contraire du Html o leur absence n'a plus beaucoup d'importance. Ainsi, l'criture suivante est incorrecte car il manque les guillemets. <date anniversaire=071185> La bonne criture est : <date anniversaire="071185">

Das könnte Ihnen auch gefallen