Auteur: Jérôme Forget. Publié le 8 juillet 2006.
XML (eXtensible Markup Language, ou Langage à balises extensibles) est en quelque sorte un langage HTML amélioré permettant de définir ses propres balises. Il s'agit donc d'un langage permettant de mettre en forme des documents à l'aide de balises.
Contrairement à HTML, qui est un langage défini et figé, XML peut être considéré comme un métalangage permettant de définir d'autres langages, c'est à dire de nouvelles balises permettant la présentation d'un texte. La force de XML réside dans sa capacité à pouvoir décrire n'importe quel domaine de données grâce à son extensibilité. Il permet de structurer, poser le vocabulaire et la syntaxe des données qu'il va contenir.
Les balises XML décrivent le contenu plutôt que la présentation. Ainsi, XML permet de séparer le contenu de la présentation. Cela permet d'afficher un même document sur des applications ou des périphériques différents sans pour autant devoir créer autant de versions du document que l'on nécessite de représentation.
XML a été mis au point par le XML Working Group sous l'égide du Wolrd Wide Web Consortium (W3C) dès 1996. Depuis février 1998, les spécifications XML 1.0 ont été reconnues comme recommandations par le W3C, ce qui en fait un langage reconnu.
XML est un langage dérivé de SGML (Standard Generalized Markup Language), tout comme le HTML. Il s'agit d'une simplification de SGML afin de le rendre utilisable sur le web.
La mise en page d'un document XML est assurée par un langage de mise en page tiers. À l'heure actuelle, il existe trois solutions pour mettre en forme un document XML:
XML fournit un moyen de vérifier la syntaxe d'un document grâce aux DTD (Document Type Definition). Il s'agit d'un fichier décrivant la structure des documents y faisant référence grâce à un langage adapté. Ainsi un document XML doit suivre scrupuleusement les conventions de notation XML et peut éventuellement faire référence à une DTD décrivant l'imbrication des éléments possibles. Un document suivant les règles de XML est appelé document bien formé. Un document XML possédant une DTD et étant conforme à celle-ci est appelé document valide.
XML permet donc de définir un format d'échange selon les besoins de l'utilisateur et offre des mécanismes pour vérifier la validité du document produit. Il est donc essentiel pour le receveur d'un document XML de pouvoir extraire les données du document. Cette opération est possible à l'aide d'un outil appelé analyseur (en anglais parser, parfois francisé en parseur ).
Le parseur permet d'une part d'extraire les données d'un document XML (on parle d'analyse du document ou de parsing) ainsi que de vérifier éventuellement la validité du document.
Voici les principaux atouts de XML:
Ainsi, XML est particulièrement adapté à l'échange de données et de documents.
L'intérêt de disposer d'un format commun d'échange d'information dépend du contexte professionnel dans lequel les utilisateurs interviennent. C'est pourquoi, de nombreux formats de données issus de XML apparaissent (il en existe plus d'une centaine) :