Fichier Unicode dans Bloc-notes [fermé]

Qu'est-ce que cela signifie Quand je sauve un fichier texte comme "Unicode" dans le bloc-notes? c'est de l'Utf-8, Utf-16 ou Utf-32? Merci à l'avance.

17
demandé sur FSm 2012-12-15 22:23:49

2 réponses

dans Notepad, comme dans le logiciel Windows en général, "Unicode" comme nom d'encodage signifie UTF-16 Little Endian (UTF-16LE). (J'ai d'abord pensé que ce N'était pas un UTF-16 réel, parce que Notepad++ le reconnaît comme UCS-2 et montre le contenu comme un déchet, mais en revérifiant avec BabelPad, j'ai conclu que Notepad peut encoder même les caractères non-BMP correctement.)

de même," Unicode big endian " signifie UTF-16 Big Endian. Et "ANSI" signifie que le système natif de l'héritage de codage, par exemple, la 8-bits de windows-1252 encodage dans les versions occidentales de Windows.

23
répondu Jukka K. Korpela 2012-12-15 18:50:03

Tous ces formats sont "Unicode". Mais habituellement les éditeurs sur Mac et Windows signifient UTF-8 avec cela parce qu'il est compatible ASCII en dessous du Code 128 IIRC. UTF-8 peut représenter plus de codes que seulement 256 (ce qui correspond à un seul octet de 8 bits) en utilisant un caractère spécial qui signifie que le octet suivant appartient également au même caractère.

si vous regardez la sortie dans le terminal, disons avec vi, et si vous voyez un espace entre deux caractères alors vous regardez UTF-16 parce que là tous les deux octets forment un caractère. Ce que vous devriez voir, c'est que les caractères n'ont pas d'espaces entre eux, c'est une indication pour UTF-8.

-4
répondu Cocoanetics 2012-12-15 18:27:43