preguntar acerca de byte-order-mark

6
réponses

Convertir UTF-8 avec nomenclature en UTF-8 sans nomenclature en Python

Deux questions ici. J'ai un ensemble de fichiers qui sont généralement UTF-8 avec BOM. Je voudrais les convertir (idéalement en place) en UTF-8 sans nomenclature. Il semble que codecs.StreamRecoder(stream, encode, decode, Reader, Writer, errors) gére …
demandé sur 1970-01-01 00:33:32
3
réponses

Encodage.UTF8.GetString ne tient pas compte du préambule/BOM

.NET, je suis en train d'utiliser Encoding.UTF8.GetString méthode, qui prend un tableau d'octets, et la convertit en un string. on dirait que cette méthode ignore le BOM (Byte Order Mark), qui pourrait être une partie d'une représentation binaire l …
demandé sur 1970-01-01 00:33:32
3
réponses

XDocument: sauvegarder XML dans un fichier sans BOM

je suis de la génération d'un utf-8 XML le fichier à l'aide de XDocument. XDocument xml_document = new XDocument( new XDeclaration("1.0", "utf-8", null), new XElement(ROOT_NAME, …
demandé sur 1970-01-01 00:33:31
4
réponses

Comment GetBytes () en C# avec UTF8 encoding avec BOM?

J'ai un problème avec L'encodage UTF8 dans mon asp.net mvc 2 application in C#. J'essaie de laisser l'Utilisateur télécharger un simple fichier texte à partir d'une chaîne. J'essaie d'obtenir un tableau d'octets avec la ligne suivante: var x = Encod …
demandé sur 1970-01-01 00:33:30
2
réponses

XML-les données au niveau de la racine sont invalides

j'ai un fichier XSD qui est encodé en UTF-8, et tout éditeur de texte que je l'exécute ne montre aucun caractère au début du fichier, mais quand je le sors dans le débogueur de Visual Studio, je vois clairement une boîte vide devant le fichier. …
demandé sur 1970-01-01 00:33:28
3
réponses

Comment éviter de trébucher sur UTF-8 BOM lors de la lecture de fichiers

je suis en train de consommer un flux de données qui a récemment ajouté un en-tête Unicode BOM (U+FEFF), et ma tâche rake est maintenant fichue par elle. je peux sauter les 3 premiers octets avec file.gets[3..-1] mais y a-t-il une façon plus …
demandé sur 1970-01-01 00:33:29
8
réponses

Le marquage d’ordre d’octet fait foirer la lecture de fichiers en Java

j'essaie de lire des fichiers CSV en utilisant Java. Certains fichiers peuvent avoir un octet au début, mais pas tous. Lorsqu'il est présent, l'ordre des octets est lu en même temps que le reste de la première ligne, ce qui cause des problèmes avec l …
demandé sur 1970-01-01 00:33:29
22
réponses

Comment puis-je supprimer les  du début d’un fichier?

j'ai un fichier CSS qui a l'air bien quand je l'ouvre en utilisant gedit , mais quand il est lu par PHP( pour fusionner tous les fichiers CSS en un seul), ce CSS a les caractères suivants préprogrammés à elle: ï " ¿ PHP supprime tous les …
demandé sur 1970-01-01 00:33:30
2
réponses

Comment puis-je supprimer le BOM de XmlTextWriter en utilisant C#?

Comment supprimer le BOM d'un fichier XML qui est créé? j'ai essayé D'utiliser la nouvelle méthode UTF8Encoding(false), mais elle ne fonctionne pas. Voici le code que j'ai: XmlDocument xmlDoc = new XmlDocument(); XmlTextWriter xmlWrit …
demandé sur 1970-01-01 00:33:29
30
réponses

Comment puis-je produire un CSV UTF-8 en PHP que Excel Lira correctement?

j'ai ce truc très simple qui ne sort que des trucs au format CSV, mais ça doit être UTF-8. J'ouvre ce fichier dans TextEdit ou TextMate ou Dreamweaver et il affiche les caractères UTF-8 correctement, mais si je l'ouvre dans Excel il fait ce genre de …
demandé sur 1970-01-01 00:33:30