Est-il possible de lire des colonnes catégoriques avec le CSV de lecture des pandas?
J'ai essayé de passer le dtype
paramètre read_csv
comme dtype={n: pandas.Categorical}
mais cela ne fonctionne pas correctement (le résultat est un Objet). le manuel n'est pas clair.
25
demandé sur
jezrael
2015-05-16 08:49:22
2 réponses
Dans la version 0.19.0
vous pouvez utiliser le paramètre dtype='category'
dans read_csv
:
data = 'col1,col2,col3\na,b,1\na,b,2\nc,d,3'
df = pd.read_csv(StringIO(data), dtype='category')
print (df)
col1 col2 col3
0 a b 1
1 a b 2
2 c d 3
print (df.dtypes)
col1 category
col2 category
col3 category
dtype: object
23
répondu
jezrael
2016-10-03 11:24:56
Categorical n'est pas un dtype valide .
Ce message StackOverflow contient des détails sur la façon de stocker des données catégoriques dans un fichier texte.
3
répondu
Alexander
2017-05-23 11:47:10