Est-il possible de lire des colonnes catégoriques avec le CSV de lecture des pandas?

J'ai essayé de passer le dtype paramètre read_csv comme dtype={n: pandas.Categorical} mais cela ne fonctionne pas correctement (le résultat est un Objet). le manuel n'est pas clair.

25
demandé sur jezrael 2015-05-16 08:49:22

2 réponses

Dans la version 0.19.0 vous pouvez utiliser le paramètre dtype='category' dans read_csv:

data = 'col1,col2,col3\na,b,1\na,b,2\nc,d,3'
df = pd.read_csv(StringIO(data), dtype='category')
print (df)

  col1 col2  col3
0    a    b     1
1    a    b     2
2    c    d     3

print (df.dtypes)
col1    category
col2    category
col3    category
dtype: object
23
répondu jezrael 2016-10-03 11:24:56

Categorical n'est pas un dtype valide .

Ce message StackOverflow contient des détails sur la façon de stocker des données catégoriques dans un fichier texte.

3
répondu Alexander 2017-05-23 11:47:10