Les noms de jeu de caractères sont-ils sensibles à la casse dans HTTP?

Ceci est un suivi de les en-têtes HTTP sont-ils sensibles à la casse?.

Dans L'en-tête HTTP Content-Type, j'ai vu des noms de jeux de caractères exprimés à la fois en majuscules et en minuscules. Par exemple, pour le jeu de caractères UTF-8:

Content-Type: text/html; charset=UTF-8

Content-Type: text/html; charset=utf-8

Voici quelques variantes de cas mixtes (les deux derniers n'étant certainement pas probables dans le monde réel):

Content-Type: text/html; charset=Utf-8

Content-Type: text/html; charset=UtF-8

Content-Type: text/html; charset=uTf-8

Toutes les formes sont-elles également valables? Ou, les applications client et serveur ignorent-elles la casse du nom du jeu de caractères simplement être flexible? Sinon, les applications qui ne reconnaissent qu'une seule représentation sont-elles non conformes?

26
demandé sur DavidRR 2013-10-16 01:14:39

1 réponses

[Voici le résultat de mes recherches.]

RFC 2616 clause 3.4 dit ce qui suit:

Les jeux de caractères HTTP sont identifiés par des jetons insensibles à la casse. Le l'ensemble complet de jetons est défini par le registre du jeu de caractères IANA [19].

charset = token

Le registre du jeu de caractères IANA {[17] } est maintenant maintenu ici . Tout en haut de ce document sous Note, le deuxième paragraphe se lit comme suit:

Les noms des jeux de caractères peuvent contenir jusqu'à 40 caractères caractères imprimables de US-ASCII. Cependant, aucune distinction n'est faite entre l'utilisation des lettres majuscules et minuscules.

Conclusion: Ces deux références indiquent que cas n'a pas d'importance pour spécifier un jeu de caractères du nom.

35
répondu DavidRR 2013-10-15 21:14:39