Jour 7 : Identifier votre langue
Vous connaissez la langue avec laquelle vous écrivez, dites le à vos lecteurs... et surtout à leur logiciel.
Qui en bénéficie ?
- Jackie en bénéficie. Son logiciel de lecture d'écran (JAWS) a besoin de savoir la langue avec laquelle vos pages ont été écrites, ainsi il peut prononcer les mots de façon appropriée quand il les lit à voix haute. Si vous n'identifiez pas la langue, JAWS tentera de deviner la langue que vous avez utilisée. Il peut se tromper, surtout si vous avez mis du code source dans vos page ou si vous avez inclus un contenu dans une autre langue dans vos pages.
- Google en bénéficie, même si vous écrivez en anglais, mais plus particulièrement si vous écrivez dans une autre langue. Selon le Google Zeitgeist, 50% des utilisateurs de Google recherchent dans une langue différente de l'anglais et de nombreux utilisateurs spécifient dans leurs préférences Google de ne chercher uniquement les pages dans des langues particulières. Les algorithmes d'auto-détection de la langue sont de plus en plus performants, mais pourquoi rendre la tâche de Google plus difficile ?
Comment faire ?
Tout d'abord, trouvez le bon code à deux caractères identifiant la langue. Le code pour l'anglais est "en
" ; le code pour le français est "fr
" ; l'allemand est "de
". Si vous écrivez dans une autre langue, vérifiez votre code de langue dans cette liste. Les codes de langue ne sont pas sensibles à la casse.
Vous devez maintenant ajouter votre code de langue dans la balise <html>
. Plus exactement, cela dépendra de la version de HTML que vous allez utiliser. Vérifiez votre DOCTYPE
, et choisissez l'une des méthodes suivantes :
Si vous utilisez une variante de
HTML 4
, changez la balise<html>
de cette façon (utilisez votre code de langue si ce n'est pas du français) :<html lang="fr">
Si vous utilisez une variante de
XHTML 1.0
, changez votre balise<html>
en ceci (utilisez votre code de langue aux deux endroits) :<html xmlns="http://www.w3.org/1999/xhtml" lang="fr" xml:lang="fr">
Si vous utilisez
XHTML 1.1
, changez votre balise<html>
comme ceci (une fois de plus, utilisez votre propre code de langue):<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="fr">
De la même façon que pour le DOCTYPE
, vous devrez identifier votre langue sur chaque page de votre site web.
Une note supplémentaire : Si vous avez plus d'une langue dans une page, vous pouvez identifier la langue de tous éléments contenant le texte. Par exemple, si votre site web utilise HTML 4 et est principalement en allemand, et que vous faites référence à un article en français, vous pouvez le baliser de cette façon :
<html lang="de"> ... <blockquote lang="fr"> ... </blockquote>
Approfondir
- Liste des codes de langue
- L'attribut
lang
dans la spécification HTML - Jim Thatcher sur le support de l'attribut
lang
dans les lecteurs d'écran (en anglais). Il explique les algorithmes d'auto-détection de la langue sont peu efficaces et il est particulièrement au courant, puisqu'il a créé celui pour Home Page Reader. D'autres lecteurs d'écran ont ajouté le support pour l'attributlang
depuis qu'il a écrit ce commentaire, mais les algorithmes d'autodétections sont toujours aussi peu efficaces rendant encore plus importante la nécessité d'identifier votre langue.