preguntar acerca de non-ascii-characters

2
réponses

Remplacer les caractères accentués dans R par des caractères équivalents non accentués (encodage UTF-8) [dupliquer]

Cette question a déjà une réponse ici: remplacer les lettres multiples par des accents avec gsub 10 réponses j'ai quelques chaînes de caractères dans le codage UTF …
demandé sur 1970-01-01 00:33:33
8
réponses

Comment récupérer une url non-ascii avec urlopen Python?

je dois récupérer des données à partir d'une URL avec des caractères non-ascii mais urllib2.urlopen refuse d'ouvrir la ressource et soulève: UnicodeEncodeError: 'ascii' codec can't encode character u'u0131' in position 26: ordinal not in range(128) …
demandé sur 1970-01-01 00:33:30
4
réponses

«UnicodeEncodeError:’ ascii ‘ codec ne peut pas encoder le caractère»

j'essaie de passer de grandes chaînes de caractères HTML aléatoires à travers des expressions régulières et mon script python 2.6 s'étouffe là-dessus: UnicodeEncodeError:' ascii 'codec ne peut pas encoder le caractère Je l'ai tracé j …
demandé sur 1970-01-01 00:33:29
2
réponses

Suppression des caractères non-ascii d’un type de chaîne donné en Python

>>> teststring = 'aõ' >>> type(teststring) <type 'str'> >>> teststring 'axf5' >>> print teststring aõ >>> teststring.decode("ascii", "ignore") u'a' >>> teststring.decode("ascii", "ignore").e …
demandé sur 1970-01-01 00:33:30
5
réponses

R sous Windows: encodage des caractères hell

j'essaie d'importer un CSV encodé comme OEM-866 (jeu de caractères cyrilliques) dans R sous Windows. J'ai aussi une copie qui a été converti en UTF-8 sans BOM. Ces deux fichiers sont lisibles par toutes les autres applications sur mon système, une fo …
demandé sur 1970-01-01 00:33:33