Comment vérifier l'encodage D'un fichier CSV
4 réponses
vous pouvez simplement ouvrir le fichier en utilisant le bloc-notes et ensuite aller au fichier - > Enregistrer sous. À côté du bouton Enregistrer, il y aura une goutte d'encodage vers le bas et l'encodage courant du fichier y sera sélectionné.
Dans les systèmes Linux, vous pouvez utiliser le fichier la commande. Il vous donnera le bon codage
Exemple:
file blah.csv
Sortie:
blah.csv: ISO-8859 text, with very long lines
Utiliser chardethttps://github.com/chardet/chardet la documentation est courte et facile à lire).
installer python, puis pip installer chardet, enfin utiliser la commande en ligne de commande.
j'ai testé sous GB2312 et c'est assez précis. (Assurez-vous d'avoir au moins quelques caractères, échantillon avec 1 seul personnage peut échouer facilement).
file
n'est pas fiable que vous pouvez voir.
si vous utilisez Python, utilisez simplement une fonction print () pour vérifier l'encodage d'un fichier csv. Par exemple:
with open('file_name.csv') as f:
print(f)
La sortie est quelque chose comme ceci:
<_io.TextIOWrapper name='file_name.csv' mode='r' encoding='utf8'>