La version française de cette traduction est :
http://www.la-grange.net/w3c/html4.01/

Traducteur : Karl Dubost - <karl+misc@la-grange.net> dans le cadre de l'effort de la liste de discussion w3c-translators.fr@w3.org
La version française peut contenir des erreurs. La version anglaise de cette note est l'unique version normative. Version originale : http://www.w3.org/TR/1999/REC-html401-19991224


6 Les types de données HTML de base

Sommaire

  1. L'information de casse
  2. Les types SGML de base
  3. Les chaînes textuelles
  4. Les URI
  5. Les couleurs
    1. Remarques sur l'utilisation des couleurs
  6. Les longueurs
  7. Les types de contenu (les types MIME)
  8. Les codes de langue
  9. Les encodages de caractères
  10. Les caractères seuls
  11. Les dates et les heures
  12. Les types de lien
  13. Les descripteurs de média
  14. Les données des scripts
  15. Les données des feuille de style
  16. Les noms des cadres cibles

Cette section de la spécification décrit les types de données de base qui peuvent apparaître dans le contenu d'un élément ou dans la valeur d'un attribut.

Pour une introduction à la lecture du DTD de HTML, veuillez consulter le tutoriel SGML.

6.1 L'information de casse

Chaque définition d'attribut contient des informations concernant la sensibilité à la casse pour les valeurs qu'il admet. L'information de casse est présentée selon les clés suivantes :

CS
La valeur est sensible à la casse [ndt. case-sensitive] (i.e., l'agent utilisateur interpréte « a » et « A » différemment).
CI
La valeur est insensible à la casse [ndt. case-insensitive] (i.e., l'agent utilisateur interpréte « a » et « A » de la même manière).
CN
La valeur n'est pas concernée par le changement de casse [ndt. case-neutral], par exemple, parce que c'est un nombre ou un caractère issu du jeu de caractères du document.
CA
La définition de l'élément, ou de l'attribut, donne par elle-même l'information de casse.
CT
Consultez la définition de type pour les détails sur l'information de casse.

Si une valeur d'attribut est constituée d'une liste de valeurs, les clés s'appliquent à toutes les valeurs dans la liste, à moins que précisé autrement.

6.2 Les types SGML de base

La définition de type de document spécifie la syntaxe du contenu des éléments et des valeurs des attributa HTML en utilisant les atomes [ndt. tokens] SGML par exemple, PCDATA, CDATA, NAME, ID, etc.). Voir [ISO8879] pour obtenir leurs définitions complètes. Les lignes suivantes constituent un résumé des points-clés :

6.3 Les chaînes textuelles

Un certain nombre d'attributs (entité %Text; dans le DTD) prennent comme valeur du texte destiné à une « lecture humaine ». Pour une introduction aux attributs, veuillez consulter les explications du mode d'emploi des attributs.

6.4 Les URI

La spécification utilise le terme URI, comme défini dans [URI] (voir également le document [RFC1630]).

Remarquez que les URI comprennent les URL (tels que définis dans les documents [RFC1738] et [RFC1808]).

Les URI relatifs se résolvent en URI complets en utilisant un URI de base. Le document [RFC1808], section 3, définit l'algorithme normatif pour cette opération. Pour en savoir plus sur les URI de base, veuillez consulter la section sur les URI de base dans le chapitre sur les liens.

Les URI sont représentés dans le DTD par l'entité paramètre %URI;.

Les URI sont en général sensibles à la casse. Il peut y avoir des URI, ou des parties de ceux-ci, pour lesquels la casse n'a pas d'importance (par exemple, les noms des machines), mais leur identification peut être difficile. Les utilisateurs devraient toujours considérer, par précaution, que les URI sont sensibles à la casse.

Veuillez consulter l'appendice pour en savoir plus sur les caractères non-ASCII dans les valeurs d'attribut des URI.

6.5 Les couleurs

Le type de valeur d'attribut « color » (entité %Color;) se rapporte aux définitions des couleurs comme spécifiées dans [SRGB]. Une valeur de couleur peut soit être un nombre hexadécimal (préfixé par un caractère dièse « # »), soit l'un des 16 noms de couleur suivants. Ces noms de couleur sont insensibles à la casse.

Noms des couleurs et valeurs sRGB
Black = "#000000" Green = "#008000"
Silver = "#C0C0C0" Lime = "#00FF00"
Gray = "#808080" Olive = "#808000"
White = "#FFFFFF" Yellow = "#FFFF00"
Maroon = "#800000" Navy = "#000080"
Red = "#FF0000" Blue = "#0000FF"
Purple = "#800080" Teal = "#008080"
Fuchsia = "#FF00FF" Aqua = "#00FFFF"

Ainsi, les valeurs de couleur "#800080" et "Purple" désignent toutes deux la même couleur violette.

6.5.1 Remarques sur l'utilisation des couleurs

Bien que les couleurs puissent apporter beaucoup d'informations aux documents et les rendre plus lisibles, veuillez considérer les principes directeurs suivants quand on ajoute de la couleurs à ses documents :

6.6 Les longueurs

HTML spécifie trois types de valeurs de longueur pour les attributs :

  1. Pixels : la valeur (entité %Pixels; dans le DTD) est un entier qui représente le nombre de pixels de canevas (écran, papier). Ainsi, la valeur "50" signifie cinquante pixels. Pour obtenir des informations normatives sur la définition d'un pixel, veuillez consulter [CSS1] ;
  2. Longueur : la valeur (entité %Length; dans le DTD) peut être soit un type « %Pixel; », soit un pourcentage de l'espace horizontal ou vertical disponible. Ainsi, la valeur "50%" signifie la moitié de l'espace disponible ;
  3. Longueur multiple : la valeur (entité %MultiLength; dans le DTD) peut être une valeur de type « %Length; » ou une longueur relative. Une longueur relative a la forme "i*", où « i » est un entier. Lors de l'affectation d'un espace aux éléments en compétition pour cet espace, l'agent utilisateur affecte en premier les longueurs en pixels et en pourcentages, puis répartit l'espace restant disponible entre les longueurs relatives. Chaque longueur relative reçoit une portion de l'espace disponible qui est proportionnelle à l'entier précédent le caractère « * ». La valeur "*" équivaut à "1*". Donc, si l'espace disponible fait 60 pixels, après que l'agent utilisateur a affecté les espaces exprimés en pixels et en pourcentage, et si les longueurs relatives en compétition ont pour valeur "1*", "2*" et "3*", la longueur relative de valeur "1*" recevra 10 pixels, celle de valeur "2*" recevra 20 pixels et celle de valeur "3*" 30 pixels.

Les valeurs de longueurs sont neutres à la casse.

6.7 Les types de contenu (les types MIME)

Remarque : Un « type de média », défini dans les documents [RFC2045] et [RFC2046], spécifie la nature d'une ressource reliée. Cette spécification emploie le terme "« type de contenu » plutôt que « type de média » en accord avec l'usage courant. Dans cette spécification toujours, un « type de média » peut se rapporter à l'attribut media en fonction duquel l'agent utilisateur va restituer le document.

Ce type est représenté dans le DTD par l'entité %ContentType;.

Les types de contenu sont insensibles à la casse.

Les types de contenu comprennent, par exemple, "text/html", "image/png", "image/gif", "video/mpeg", "text/css" et "audio/basic". Pour obtenir la liste actuelle des types MIME enregistrés, veuillez consulter [MIMETYPES].

6.8 Les codes de langue

La valeur des attributs dont le type est un code de langue (entité %LanguageCode; dans le DTD) se rapporte à un code de langue, comme spécifié par le document [RFC1766], section 2. Pour en savoir plus sur les codes de langue en HTML, veuillez consulter la section sur les codes de langue. Les caractères blancs ne sont pas autorisés dans les codes de langue.

Les codes de langues sont insensibles à la casse.

6.9 Les encodages de caractères

Les attributs « charset » (entité %Charset; dans le DTD) se rapportent à un encodage de caractères, comme défini dans la section sur les encodages de caractères. Les valeurs doivent être des chaînes de caractères (par exemple, "euc-jp") qui proviennent du registre IANA (voir [CHARSETS] pour la liste complète).

Les noms des encodages de caractère sont insensibles à la casse.

Les agents utilisateurs doivent suivre les étapes établies dans la section sur la spécification des encodages de caractères afin de déterminer l'encodage de caractères d'une ressource externe.

6.10 Les caractères seuls

Certains attributs appellent un seul caractère provenant du jeu de caractères du document. Ces attributs prennent le type %Character; dans le DTD.

Les caractères seuls peuvent être spécifiés avec des références de caractères (par exemple, « &amp; »).

6.11 Les dates et les heures

La norme [ISO8601] autorise de nombreuses options et variations pour représenter les dates et les heures. Cette spécification utilise l'un des formats décrits dans le profil [DATETIME] pour sa définition des chaînes date/heure autorisées (entité %Datetime; dans le DTD).

Le format est le suivant :

  AAAA-MM-JJThh:mm:ssTZD
dans lequel :
     AAAA = l'année en 4 chiffres
     MM   = le mois en 2 chiffres (01=janvier, etc.)
     JJ   = le jour du mois en 2 chiffres (01 à 31)
     hh   = l'heure en 2 chiffres (00 à 23) (am/pm NON admis)
     mm   = les minutes en 2 chiffres (00 à 59)
     ss   = les secondes en 2 chiffres (00 à 59)
     TZD  = l'indicateur du fuseau horaire

L'indicateur du fuseau horaire prend l'une des formes suivantes :

Z
indique le temps universel coordonné UTC. Le « Z » doit être en majuscule.
+hh:mm
indique une heure locale qui corresponda à hh heures et mm minutes en avance sur le temps UTC.
-hh:mm
indique une heure locale qui correspond à hh heures et mm minutes en retard sur le temps UTC.

Les composants doivent être présents avec le formalisme et la ponctuation exacts exposés ici. Remarquez que le « T » apparaît littéralement dans la chaîne (il doit être en majuscule), pour indiquer le début de l'élément heure, comme spécifié dans la norme [ISO8601]

Si une application de génération ne connaît pas l'heure à la seconde, elle peut utiliser la valeur "00" pour les secondes (et les minutes et les heures si nécessaire).

Remarque : Le profil [DATETIME] ne règle pas la question des sauts de seconde.

6.12 Les types de lien

Les auteurs peuvent utiliser les types de liens reconnus suivants, qui sont listés avec leur interprétation conventionnelle. Dans le DTD, l'entité %LinkTypes; se rapporte à une liste de types de lien, séparés par des espaces. Les caractères blancs ne sont pas autorisés dans les types de lien.

Ces types de liens sont insensibles à la casse, i.e., la valeur "Alternate" a la même signification que "alternate".

Les agents utilisateurs, les moteurs de recherche, etc. peuvent interpréter ces types de liens de diverses manières. Par exemple, les agents utilisateurs peuvent fournir l'accès aux documents reliés au moyen d'une barre de navigation.

Alternate
Désigne les versions de remplacement du document dans lequel le lien survient. Quand ce type accompagne l'attribut lang, il implique une version traduite du document. Quand il accompagne l'attribut media, il implique une version du document conçue pour un ou plusieurs médias différents.

errata-09

Stylesheet
Se rapporte à une feuille de style externe. Voir la section sur les feuilles de style externes pour plus de détails. Il est également utilisé avec le type de lien "Alternate" pour les feuilles de style alternatives sélectionnables par l'utilisateur.
Start
Se rapporte au premier document d'une succession de documents. Ce type de lien indique aux moteurs de recherche le document que l'auteur considère être le point de départ de la succession.
Next
Se rapporte au document suivant dans une succession linéaire de documents. Les agents utilisateurs peuvent choisir de pré-charger ce document suivant, pour réduire le temps de chargement perceptible.
Prev
Se rapporte au document précédent dans une succession ordonnée de documents. Certains agents utilisateurs reconnaissent également le synonyme "Previous".
Contents
Se rapporte au document qui fait office de table des matières. Certains agents utilisateurs reconnaissent également le synonyme "ToC" [ndt. Table of Contents].
Index
Se rapporte au document qui fournit un index du document courant.
Glossary
Se rapporte au document qui fournit un glossaire des termes relatifs au document courant.
Copyright
Se rapporte à la déclaration de droits d'auteur pour le document courant.
Chapter
Se rapporte au document faisant office de chapitre dans une succession de documents.
Section
Se rapporte au document faisant office de section dans une succession de documents.
Subsection
Se rapporte au document faisant office de sous-section dans une succession de documents.
Appendix
Se rapporte au document faisant office d'appendice dans une succession de documents.
Help
Se rapporte à un document d'aide (compléments d'informations, liens vers d'autre sources d'information, etc.)
Bookmark
Se rapporte à un signet. Un signet représente un lien vers un point d'entrée clé dans un document complémentaire. L'attribut title peut être utilisé, par exemple, pour étiqueter le signet. Remarquez qu'on peut définir plusieurs signets dans chaque document.

Les auteurs peuvent souhaiter définir des types de liens supplémentaires qui ne sont pas décrits dans cette spécification. Le cas échéant, ils devraient utiliser un profil pour citer les conventions employées pour définir les types de lien. Voir l'attribut profile de l'élément HEAD pour plus de détails.

Pour des explications approfondies sur les types de liens, veuillez consulter la section sur liens dans les documents HTML.

6.13 Les descripteurs de média

Voici une liste des descripteurs de média reconnus (entité %MediaDesc; dans le DTD).

screen
Destiné aux écrans d'ordinateur non-paginés.
tty
Destiné aux médias utilisant une grille de caractère à pas fixe, tels que les télétypes, les terminaux ou les appareils portables avec des capacités d'affichage limitées.
tv
Destiné aux appareils de type télévision (basse résolution, couleur, défilement limité).
projection
Destiné aux projecteurs.
handheld
Destiné aux appareils manuels (petit écran, monochrome, graphique bitmap, faible bande passante).
print
Destiné aux supports paginés opaques et aux documents visionnés à l'écran en mode aperçu avant impression.
braille
Destiné aux appareils Braille.
aural
Destiné aux synthétiseurs de parole.
all
Convient pour tous les supports.

Les prochaines versions de HTML pourraient introduire de nouvelles valeurs et autoriser des valeurs paramétrées. Pour préparer l'introduction de ces extensions, les agents utilisateurs conformes doivent être capables d'analyser la valeur de l'attribut media de la façon suivante :

  1. La valeur est une liste d'entrées, séparées par des virgules. Par exemple :
    media="screen, 3d-glasses, print and resolution > 90dpi"
    

    cette déclaration correspond à :

    "screen"
    "3d-glasses"
    "print and resolution > 90dpi"
    
  2. Chaque entrée est tronquée juste avant le premier caractère qui n'est pas une lettre US ASCII [a-zA-Z] (ISO 10646 hex 41-5a, 61-7a), un chiffre [0-9] (hex 30-39) ou un trait d'union (hex 2d). Dans l'exemple, cela donnerait :
    "screen"
    "3d-glasses"
    "print"
    
  3. Une correspondance sensible à la casse est alors recherchée avec le jeu des types de média définis précédemment. Les agents utilisateurs peuvent ignorer les entrées qui n'ont aucune correspondance. Dans l'exemple, il resterait les valeurs "screen" et "print".

Remarque : Les déclarations de feuilles de style peuvent contenir des variations en fonction du média (par exemple, la structure CSS @media). Auquel cas, il serait plus approprié d'utiliser la spécification "media=all".

6.14 Les données des scripts

Les données de script (entité %Script; dans le DTD) peuvent se présenter comme contenu de l'élément SCRIPT et comme valeur des attributs d'événement intrinsèques. Les agents utilisateurs ne doivent pas évaluer les données de script en tant que balisage HTML mais plutôt les transmettre comme données à un moteur de script.

La sensibilité à la casse des données de script dépend du langage de script.

Veuillez remarquer que les données de script, qui forment le contenu d'un élément, ne peuvent pas contenir de références de caractères, à l'inverse des données de script dans la valeur d'un attribut qui peuvent en contenir. L'appendice fournit des informations plus détaillées sur la spécification de données non-HTML.

6.15 Les données des feuilles de style

Les données de feuille de style (entité %StyleSheet; dans le DTD) peuvent se présenter comme contenu de l'élément STYLE et comme valeur de l'attribut style. Les agents utilisateurs ne doivent pas évaluer les données de style en tant que balisage HTML.

La sensibilité à la casse des données de style dépend du langage de feuille de style.

Veuillez remarquer que les données de feuille de style, qui forment le contenu de l'élément, ne peuvent pas contenir de références de caractères, à l'inverse des données de style dans la valeur d'un attribut qui peuvent en contenir. L'annexe fournit des informations plus détaillées sur la spécification de données non-HTML.

6.16 Les noms des cadres cibles

À l'exception des noms réservés ci-dessous, les noms des cadres cibles (entité %FrameTarget; dans le DTD) doivent commencer par un caractère alphabétique (a-zA-Z). Les agents utilisateurs devraient ignorer tous les autres noms de cible.

Les noms de cible suivants sont réservés et ont des significations particulières :

_blank
L'agent utilisateur devrait charger le document désigné dans une nouvelle fenêtre sans nom.
_self
L'agent utilisateur devrait charger le document dans le même cadre que l'élément qui désigne cette cible.
_parent
L'agent utilisateur devrait charger le document dans l'élément FRAMESET parent immédiat du cadre courant. Cette valeur est équivalente à "_self" si le cadre courant n'a pas de parent.
_top
L'agent utilisateur devrait charger le document dans la fenêtre originale entière (de ce fait, annulant tous les autres cadres). Cette valeur est équivalente à "_self" si le cadre courant n'a pas de parent.