Page d'accueil encyclopedie-enligne.com en page d'accueil
Liste Articles: [0-A] [A-C] [C-F] [F-J] [J-M] [M-P] [P-S] [S-Z] | Liste Catégories | Une page au hasard | Pages liées

Hypertext markup language


image:Langage_progr.png
Cet article fait partie de
la série Langages de programmation
Langages orientés objet
Ada 95 - C++ - C#
Common lisp object system
Delphi - Eiffel - Java - Nice
Langages impératifs
APL - ASP
Assembleur
BASIC - C - Pascal
Perl - PHP - Python
Langages fonctionnels
ML/OCaml - Lisp/Common Lisp
Forth - Logo - Scheme
Langages déclaratifs
Clips - Prolog
Voir aussi
Conception - Codage
Tests - Optimisations


Publier de l'information en vue d'une distribution mondiale nécessite l'usage d'un langage universellement compréhensible, d'une sorte de « langue maternelle » acceptée par tous les ordinateurs. Le langage de publication utilisé sur le World Wide Web est le langage de balisage hypertexte HTML. HTML est le sigle de HyperText Markup Language (littéralement langage de marquage hypertexte.)

Sommaire

Langage de marquage hypertexte

HTML est un langage de description de documents. Son invention est fondée sur un modèle, le langage à balises SGML.

Pour expliquer les balises HTML, voici un exemple :

<p>Lorem ipsum dolor sit amet, consectetuer adipiscing elit.</p>

La phrase Lorem ispum dolor (...) est délimitée par une balise d'ouverture – <p> –, et une autre de fermeture – </p>. La seule différence entre ces deux balises est le slash. La balise p (ou <p></p>) sert à délimiter un paragraphe.

Certaines balises ne sont pas doubles, et ne contiennent pas de balise de fermeture. Sont concernées la balise d'image img, la balise de ligne de séparation hr, et la balise de retour à la ligne br.

On assiste quelquefois à des oublis de balises de fermeture en HTML, alors qu'elles sont nécessaires. Cette erreur s'est répandue sur le web, et les navigateurs sont devenus très permissifs à une certaine époque, ce qui a tendu à les complexifier encore davantage.

Les navigateurs récents ont aujourd'hui deux niveaux de compréhension d'un fichier HTML : le niveau strict, qui affiche exactement ce que le fichier HTML demande, et le niveau brouillon, qui affiche une page en supportant les erreurs les plus fréquentes. C'est au vu de l'en-tête du document (le doctype plus précisément) que le navigateur choisit le mode à adopter.

Sémantique HTML

Tel qu'il a été pensé à ses origines par Tim Berners-Lee, le HTML ne sert pas à décrire le rendu visuel des pages web (contrairement à la PAO), mais plutôt le sens des différentes parties du texte : titre, liste, mise en évidence... Ces valeurs ont été de moins en moins respectées au cours du développement du langage.

L'exemple le plus flagrant est celui de l'utilisation abusive des tableaux en HTML. L'utilisation des tableaux devrait être limitée, comme son nom l'indique, à des données tabulaires (statistiques, fréquence, assocations à deux dimensions, etc.), mais les webmestres ont au fur et à mesure utilisé cet élément pour pallier un manque crucial d'éléments permettant de positionner n'importe où un élément HTML. Depuis, le CSS a fait son apparition, permettant de décrire la façon dont les éléments HTML doivent être positionnés.

Accéder à une page HTML

C'est le protocole HTTP qui, sur le web, permet de transférer à partir d'un Serveur Web, un fichier HTML. Lorsque le serveur web reçoit une demande concernant un fichier, il est possible qu'il ait à générer une partie du fichier suivant les indications qu'aura eu soin de lui laisser l'auteur de la page. (cf langages spécialisés web.)

Les documents HTML sont identifiés par une adresse URI, et sont interprétés par un logiciel appelé Navigateur Web. Grâce à ce dernier, le fichier HTML apparaît à l'écran comme l'auteur l'a voulu. Sont ainsi représentés texte, typographie, couleurs, tableaux, images, parfois du son, etc.

Interopératibilité

Le web dépend des auteurs de pages et des éditeurs de logiciels qui partagent les mêmes conventions pour HTML. Cela a motivé un travail commun sur les spécifications de HTML. Permettre aux documents HTML d'être accessibles sur des plates-formes et des navigateurs différents est fondamental dans la conception de ce langage.

L'ambition de Tim Berners-Lee était d'avoir un langage de description de documents au format ouvert qui soit indépendant de ce qui servirait à lire les pages. Par conséquent, il n'est pas prévu que telle ou telle police de caractère soit utilisée explicitement, ni que le moniteur du client utilise telle ou telle résolution. Le logiciel exploité pour la navigation devrait lui aussi ne pas être une source de discrimination.

Parvenir à l'interopérabilité permet de baisser les coûts des fournisseurs de contenus parce qu'ils n'ont à développer qu'une seule version d'un document. Si cet effort n'est pas fait, le risque est grand de voir le Web régresser vers un monde propriétaire de formats incompatibles, en réduisant en fin de compte son potentiel commercial au détriment de tous ses participants.

Chaque version HTML a essayé de refléter le plus grand consensus entre les acteurs de l'industrie, de sorte que les investissements consentis par les fournisseurs de contenus ne soient pas gaspillés et que leurs documents ne deviennent en peu de temps illisibles.

Le langage HTML a été développé avec l'intuition que les appareils de toutes sortes devaient pouvoir utiliser les informations sur le Web : les ordinateurs personnels avec des écrans de résolution et de profondeur de couleurs variables, les téléphones cellulaires, les appareils portables, les appareils de synthèse et de reconnaissance de la parole, les ordinateurs avec une bande passante faible comme élevée, et ainsi de suite.

Historique

1989 - 1992

HTML a été inventé pour le World Wide Web, afin de pouvoir écrire des documents hypertextes liant les différentes ressources d'Internet. En août 1991, lorsque Tim Berners-Lee annonce publiquement le Web sur Usenet, il ne cite que le langage SGML, mais donne l'URL d'un document ayant l'extension de fichier html.

Les premiers éléments du langage HTML sont le titre du document, les hyperliens, la mise en forme du texte en titres, sous-titres, listes ou texte brut, et un mécanisme basique de recherche par index. La description de HTML est alors assez informelle, elle est principalement définie par le support des divers navigateurs Web contemporains.

1993

L'état de HTML correspond alors à ce que l'on pourrait appeler HTML 1.0. Il n'existe cependant aucune spécification portant ce nom, notamment parce que le langage était alors en pleine évolution. Un effort de normalisation était cependant en cours [1] . À partir de fin 1993, le terme HTML+ sera utilisé pour désigner la version future de HTML.

Avec le navigateur NCSA Mosaic, HTML connaît deux inventions majeures : l'invention de l'élément IMG permet d'intégrer des images (GIF ou XBM) aux pages Web (Mosaic 0.10) ; les formulaires rendent le World Wide Web interactif (Mosaic 2.0pre5).

1994

Avec l'apparition de Netscape Navigator 0.9 le 13 octobre, le support de nombreux éléments de présentation est ajouté : styles de texte, clignotement, centrage... Le développement de HTML prend alors deux voies divergentes. D'une part, les développeurs de navigateurs s'attachent à maximiser l'impact visuel des pages Web. D'autre part, les concepteurs du Web proposent d'étendre les capacités de description sémantiques (logos, notes de bas de page...) et les domaines d'applications (formules mathématiques, tables) de HTML. En ceci, ils suivent les principes de SGML consistant à laisser la présentation à un langage de style. En l'occurrence, CSS est prévu pour HTML.

Seul le support des tables est rapidement intégré aux navigateurs, notamment parce qu'il permet une très nette élaboration de la présentation. Le manque de structure du HTML alors mis en œuvre par Netscape Navigator, puis Microsoft Internet Explorer, est parfois dénoncé comme étant de la « soupe de balises » (« tag soup » en anglais).

1995 - 1996

En mars 1995, le W3C nouvellement fondé propose le résultat de ses recherches sur HTML+ : le brouillon HTML 3.0. Il comprend notamment le support des tables, des figures et des expressions mathématiques. Ce brouillon expire le 28 septembre 1995 sans donner de suites directes. Fin 1995, le RFC 1866 décrivant HTML 2.0 est finalisé. Ce document décrit HTML tel qu'il existait avant juin 1994, donc sans les nombreuses additions de Netscape Navigator.

1997

Le 14 janvier, le W3C publie la spécification HTML 3.2. Elle décrit la pratique courante observée début 1996, donc avec une partie des additions de Netscape Navigator et Internet Explorer. Ses plus importantes nouveautés sont la standardisation des tables et de nombreux éléments de présentation.

Le 18 décembre, le W3C publie la spécification HTML 4.0 qui standardise notamment le support les styles, les cadres (frames) et les objets (généralisation des images et des applets).

1998 - 1999

La dernière spécification de HTML est la 4.01 datant du 24 décembre 1999. Elle n'apporte que des corrections mineures à la version 4.0.

2000 à nos jours

Le développement de HTML en tant qu'application de SGML est abandonné au profit de XHTML, application de XML. La première étape est la spécification XHTML 1.0, publiée le 26 janvier 2000. Il s'agit d'une reformulation de HTML 4.01 basée sur XML au lieu de SGML. La seconde étape est la spécification XHTML 1.1, publiée le 31 mai 2001. Il s'agit d'un classement des fonctionnalités de XHTML 1.0 en modules. En outre les fonctionnalités de présentation et quelques redondances sont supprimées.

Voir aussi

[ XHTML | World Wide Web | Informatique | CSS ]

Wikilivre sur la programmation HTML

Liens externes

Recommandations du W3C en français

Quelques adresses utiles proposant des didacticiels en français



This site support the Wikimedia Foundation. This Article originally from Wikipedia. All text is available under the terms of the GNU Free Documentation License Page HistoryOriginal ArticleWikipedia