La version française de cette traduction est :
http://www.la-grange.net/w3c/html4.01/
Traducteur : Karl Dubost - <karl+misc@la-grange.net> dans le cadre de l'effort de la liste de discussion w3c-translators.fr@w3.org
La version française peut contenir des erreurs. La version anglaise de cette note est l'unique version
normative. Version originale : http://www.w3.org/TR/1999/REC-html401-19991224
Sommaire
Cette section de la spécification décrit les types de données de base qui peuvent apparaître dans le contenu d'un élément ou dans la valeur d'un attribut.
Pour une introduction à la lecture du DTD de HTML, veuillez consulter le tutoriel SGML.
Chaque définition d'attribut contient des informations concernant la sensibilité à la casse pour les valeurs qu'il admet. L'information de casse est présentée selon les clés suivantes :
Si une valeur d'attribut est constituée d'une liste de valeurs, les clés s'appliquent à toutes les valeurs dans la liste, à moins que précisé autrement.
La définition de type de document spécifie la syntaxe du contenu des éléments et des valeurs des attributa HTML en utilisant les atomes [ndt. tokens] SGML par exemple, PCDATA, CDATA, NAME, ID, etc.). Voir [ISO8879] pour obtenir leurs définitions complètes. Les lignes suivantes constituent un résumé des points-clés :
Les agents utilisateurs peuvent ignorer les blancs de tête et de queue des valeurs d'attribut de type CDATA (par exemple, " mavaleur " peut être interprété comme "mavaleur"). Les auteurs ne devraient pas déclarer les valeurs d'attributs avec des blancs de tête ou de queue.
Pour certains attributs HTML 4, avec des valeurs d'attribut de type CDATA, la spécification impose des contraintes supplémentaires sur le jeu des valeurs autorisées pour l'attribut, qui ne peuvent pas être exprimées par le DTD.
Bien que les éléments STYLE et SCRIPT utilisent le type « CDATA » pour leur modèle de données, les agents utilisateurs doivent interpréter différemment le type CDATA pour ceux-ci. Le balisage et les entités doivent être traités comme du texte brut et passés tel quel à l'application. La première occurence de la séquence de caractères « </ » (délimiteur d'ouverture de balise fermante) est traitée comme terminant la fin du contenu de l'élément. Dans les documents valides, ce serait la balise fermante de l'élément.
Un certain nombre d'attributs (entité %Text; dans le DTD) prennent comme valeur du texte destiné à une « lecture humaine ». Pour une introduction aux attributs, veuillez consulter les explications du mode d'emploi des attributs.
La spécification utilise le terme URI, comme défini dans [URI] (voir également le document [RFC1630]).
Remarquez que les URI comprennent les URL (tels que définis dans les documents [RFC1738] et [RFC1808]).
Les URI relatifs se résolvent en URI complets en utilisant un URI de base. Le document [RFC1808], section 3, définit l'algorithme normatif pour cette opération. Pour en savoir plus sur les URI de base, veuillez consulter la section sur les URI de base dans le chapitre sur les liens.
Les URI sont représentés dans le DTD par l'entité paramètre %URI;.
Les URI sont en général sensibles à la casse. Il peut y avoir des URI, ou des parties de ceux-ci, pour lesquels la casse n'a pas d'importance (par exemple, les noms des machines), mais leur identification peut être difficile. Les utilisateurs devraient toujours considérer, par précaution, que les URI sont sensibles à la casse.
Veuillez consulter l'appendice pour en savoir plus sur les caractères non-ASCII dans les valeurs d'attribut des URI.
Le type de valeur d'attribut « color » (entité %Color;) se rapporte aux définitions des couleurs comme spécifiées dans [SRGB]. Une valeur de couleur peut soit être un nombre hexadécimal (préfixé par un caractère dièse « # »), soit l'un des 16 noms de couleur suivants. Ces noms de couleur sont insensibles à la casse.
Black = "#000000" | Green = "#008000"
|
||
Silver = "#C0C0C0" | Lime = "#00FF00"
|
||
Gray = "#808080" | Olive = "#808000"
|
||
White = "#FFFFFF" | Yellow = "#FFFF00"
|
||
Maroon = "#800000" | Navy = "#000080"
|
||
Red = "#FF0000" | Blue = "#0000FF"
|
||
Purple = "#800080" | Teal = "#008080"
|
||
Fuchsia = "#FF00FF" | Aqua = "#00FFFF"
|
Ainsi, les valeurs de couleur "#800080" et "Purple" désignent toutes deux la même couleur violette.
Bien que les couleurs puissent apporter beaucoup d'informations aux documents et les rendre plus lisibles, veuillez considérer les principes directeurs suivants quand on ajoute de la couleurs à ses documents :
HTML spécifie trois types de valeurs de longueur pour les attributs :
Les valeurs de longueurs sont neutres à la casse.
Remarque : Un « type de média », défini dans les documents [RFC2045] et [RFC2046], spécifie la nature d'une ressource reliée. Cette spécification emploie le terme "« type de contenu » plutôt que « type de média » en accord avec l'usage courant. Dans cette spécification toujours, un « type de média » peut se rapporter à l'attribut media en fonction duquel l'agent utilisateur va restituer le document.
Ce type est représenté dans le DTD par l'entité %ContentType;.
Les types de contenu sont insensibles à la casse.
Les types de contenu comprennent, par exemple, "text/html", "image/png", "image/gif", "video/mpeg", "text/css" et "audio/basic". Pour obtenir la liste actuelle des types MIME enregistrés, veuillez consulter [MIMETYPES].
La valeur des attributs dont le type est un code de langue (entité %LanguageCode; dans le DTD) se rapporte à un code de langue, comme spécifié par le document [RFC1766], section 2. Pour en savoir plus sur les codes de langue en HTML, veuillez consulter la section sur les codes de langue. Les caractères blancs ne sont pas autorisés dans les codes de langue.
Les codes de langues sont insensibles à la casse.
Les attributs « charset » (entité %Charset; dans le DTD) se rapportent à un encodage de caractères, comme défini dans la section sur les encodages de caractères. Les valeurs doivent être des chaînes de caractères (par exemple, "euc-jp") qui proviennent du registre IANA (voir [CHARSETS] pour la liste complète).
Les noms des encodages de caractère sont insensibles à la casse.
Les agents utilisateurs doivent suivre les étapes établies dans la section sur la spécification des encodages de caractères afin de déterminer l'encodage de caractères d'une ressource externe.
Certains attributs appellent un seul caractère provenant du jeu de caractères du document. Ces attributs prennent le type %Character; dans le DTD.
Les caractères seuls peuvent être spécifiés avec des références de caractères (par exemple, « & »).
La norme [ISO8601] autorise de nombreuses options et variations pour représenter les dates et les heures. Cette spécification utilise l'un des formats décrits dans le profil [DATETIME] pour sa définition des chaînes date/heure autorisées (entité %Datetime; dans le DTD).
Le format est le suivant :
AAAA-MM-JJThh:mm:ssTZDdans lequel :
AAAA = l'année en 4 chiffres MM = le mois en 2 chiffres (01=janvier, etc.) JJ = le jour du mois en 2 chiffres (01 à 31) hh = l'heure en 2 chiffres (00 à 23) (am/pm NON admis) mm = les minutes en 2 chiffres (00 à 59) ss = les secondes en 2 chiffres (00 à 59) TZD = l'indicateur du fuseau horaire
L'indicateur du fuseau horaire prend l'une des formes suivantes :
Les composants doivent être présents avec le formalisme et la ponctuation exacts exposés ici. Remarquez que le « T » apparaît littéralement dans la chaîne (il doit être en majuscule), pour indiquer le début de l'élément heure, comme spécifié dans la norme [ISO8601]
Si une application de génération ne connaît pas l'heure à la seconde, elle peut utiliser la valeur "00" pour les secondes (et les minutes et les heures si nécessaire).
Remarque : Le profil [DATETIME] ne règle pas la question des sauts de seconde.
Les auteurs peuvent utiliser les types de liens reconnus suivants, qui sont listés avec leur interprétation conventionnelle. Dans le DTD, l'entité %LinkTypes; se rapporte à une liste de types de lien, séparés par des espaces. Les caractères blancs ne sont pas autorisés dans les types de lien.
Ces types de liens sont insensibles à la casse, i.e., la valeur "Alternate" a la même signification que "alternate".
Les agents utilisateurs, les moteurs de recherche, etc. peuvent interpréter ces types de liens de diverses manières. Par exemple, les agents utilisateurs peuvent fournir l'accès aux documents reliés au moyen d'une barre de navigation.
Les auteurs peuvent souhaiter définir des types de liens supplémentaires qui ne sont pas décrits dans cette spécification. Le cas échéant, ils devraient utiliser un profil pour citer les conventions employées pour définir les types de lien. Voir l'attribut profile de l'élément HEAD pour plus de détails.
Pour des explications approfondies sur les types de liens, veuillez consulter la section sur liens dans les documents HTML.
Voici une liste des descripteurs de média reconnus (entité %MediaDesc; dans le DTD).
Les prochaines versions de HTML pourraient introduire de nouvelles valeurs et autoriser des valeurs paramétrées. Pour préparer l'introduction de ces extensions, les agents utilisateurs conformes doivent être capables d'analyser la valeur de l'attribut media de la façon suivante :
media="screen, 3d-glasses, print and resolution > 90dpi"
cette déclaration correspond à :
"screen" "3d-glasses" "print and resolution > 90dpi"
"screen" "3d-glasses" "print"
Remarque : Les déclarations de feuilles de style peuvent contenir des variations en fonction du média (par exemple, la structure CSS @media). Auquel cas, il serait plus approprié d'utiliser la spécification "media=all".
Les données de script (entité %Script; dans le DTD) peuvent se présenter comme contenu de l'élément SCRIPT et comme valeur des attributs d'événement intrinsèques. Les agents utilisateurs ne doivent pas évaluer les données de script en tant que balisage HTML mais plutôt les transmettre comme données à un moteur de script.
La sensibilité à la casse des données de script dépend du langage de script.
Veuillez remarquer que les données de script, qui forment le contenu d'un élément, ne peuvent pas contenir de références de caractères, à l'inverse des données de script dans la valeur d'un attribut qui peuvent en contenir. L'appendice fournit des informations plus détaillées sur la spécification de données non-HTML.
Les données de feuille de style (entité %StyleSheet; dans le DTD) peuvent se présenter comme contenu de l'élément STYLE et comme valeur de l'attribut style. Les agents utilisateurs ne doivent pas évaluer les données de style en tant que balisage HTML.
La sensibilité à la casse des données de style dépend du langage de feuille de style.
Veuillez remarquer que les données de feuille de style, qui forment le contenu de l'élément, ne peuvent pas contenir de références de caractères, à l'inverse des données de style dans la valeur d'un attribut qui peuvent en contenir. L'annexe fournit des informations plus détaillées sur la spécification de données non-HTML.
À l'exception des noms réservés ci-dessous, les noms des cadres cibles (entité %FrameTarget; dans le DTD) doivent commencer par un caractère alphabétique (a-zA-Z). Les agents utilisateurs devraient ignorer tous les autres noms de cible.
Les noms de cible suivants sont réservés et ont des significations particulières :