Les noms de jeu de caractères sont-ils sensibles à la casse dans HTTP?
Ceci est un suivi de les en-têtes HTTP sont-ils sensibles à la casse?.
Dans L'en-tête HTTP Content-Type
, j'ai vu des noms de jeux de caractères exprimés à la fois en majuscules et en minuscules. Par exemple, pour le jeu de caractères UTF-8
:
Content-Type: text/html; charset=UTF-8
Content-Type: text/html; charset=utf-8
Voici quelques variantes de cas mixtes (les deux derniers n'étant certainement pas probables dans le monde réel):
Content-Type: text/html; charset=Utf-8
Content-Type: text/html; charset=UtF-8
Content-Type: text/html; charset=uTf-8
Toutes les formes sont-elles également valables? Ou, les applications client et serveur ignorent-elles la casse du nom du jeu de caractères simplement être flexible? Sinon, les applications qui ne reconnaissent qu'une seule représentation sont-elles non conformes?
1 réponses
[Voici le résultat de mes recherches.]
RFC 2616 clause 3.4 dit ce qui suit:
Les jeux de caractères HTTP sont identifiés par des jetons insensibles à la casse. Le l'ensemble complet de jetons est défini par le registre du jeu de caractères IANA [19].
charset = token
Le registre du jeu de caractères IANA {[17] } est maintenant maintenu ici . Tout en haut de ce document sous Note, le deuxième paragraphe se lit comme suit:
Les noms des jeux de caractères peuvent contenir jusqu'à 40 caractères caractères imprimables de US-ASCII. Cependant, aucune distinction n'est faite entre l'utilisation des lettres majuscules et minuscules.
Conclusion: Ces deux références indiquent que cas n'a pas d'importance pour spécifier un jeu de caractères du nom.