preguntar acerca de pandas

2
réponses

Pandas: supprimer les doublons consécutifs

Quel est le moyen le plus efficace de supprimer uniquement les doublons consécutifs dans les pandas? Drop_duplicates donne ceci: In [3]: a = pandas.Series([1,2,2,3,2], index=[1,2,3,4,5]) In [4]: a.drop_duplicates() Out[4]: 1 1 2 2 4 3 d …
demandé sur 1970-01-01 00:33:33
1
réponses

Comment puis-je convertir un DataFrame Pandas en une liste?

J'ai un DataFrame Python avec plusieurs colonnes. 2u 2s 4r 4n 4m 7h 7v 0 1 1 0 0 0 1 0 1 0 1 0 0 1 1 0 0 1 0 1 0 1 0 0 0 1 1 0 1 …
demandé sur 1970-01-01 00:33:33
2
réponses

Pandas: convertir des catégories en nombres

Supposons que j'ai un dataframe avec des pays qui va comme: cc | temp US | 37.0 CA | 12.0 US | 35.0 AU | 20.0 Je sais qu'il y a un pd.fonction get_dummies pour convertir les pays en 'encodages à chaud'. Cependant, je souhaite les convertir en ind …
demandé sur 1970-01-01 00:33:36
2
réponses

Interpolation sur DataFrame dans les pandas

J'ai un DataFrame, disons une surface de volatilité avec index comme temps et colonne comme grève. Comment faire une interpolation bidimensionnelle? Je peux reindex mais comment puis-je gérer NaN? Je sais que nous pouvons fillna(method='pad') mais ce …
demandé sur 1970-01-01 00:33:32
1
réponses

HDF5 prendre plus D’espace que CSV?

Prenons l'exemple suivant: Préparer les données: import string import random import pandas as pd matrix = np.random.random((100, 3000)) my_cols = [random.choice(string.ascii_uppercase) for x in range(matrix.shape[1])] mydf = pd.DataFrame(matrix, …
demandé sur 1970-01-01 00:33:33
4
réponses

En utilisant numpy.genfromtxt pour lire un fichier csv avec des chaînes contenant des virgules

J'essaie de lire dans un fichier csv avec numpy.genfromtxt mais certains des champs sont des chaînes qui contiennent des virgules. Les chaînes sont entre guillemets, mais numpy ne reconnaît pas les guillemets comme définissant une seule chaîne. Par …
demandé sur 1970-01-01 00:33:33
3
réponses

Existe-t-il un moyen dans Pandas d’utiliser la valeur de ligne précédente dans dataframe.appliquer lorsque la valeur précédente est également calculée dans appliquer?

J'ai le dataframe suivant: Index_Date A B C D =============================== 2015-01-31 10 10 Nan 10 2015-02-01 2 3 Nan 22 2015-02-02 10 60 Nan 280 2015-02-03 10 100 Nan 250 Exiger: Index_Da …
demandé sur 1970-01-01 00:33:36
3
réponses

Comment remplacer les nombres négatifs dans le cadre de données Pandas par zéro

Je voudrais savoir s'il y a quelque chose de remplacer tous les nombres négatifs de DataFrame par des zéros? ... …
demandé sur 1970-01-01 00:33:35
2
réponses

Convertir L’objet DataFrameGroupBy en pandas DataFrame

J'avais un dataframe et j'ai fait un groupby dans FIPS et j'ai résumé les groupes qui fonctionnaient bien. kl = ks.groupby('FIPS') kl.aggregate(np.sum) Je veux juste un Dataframe normal mais j'ai un objet pandas.core.groupby.DataFrameGroupBy. I …
demandé sur 1970-01-01 00:33:32
2
réponses

Est-il possible de lire des colonnes catégoriques avec le CSV de lecture des pandas?

J'ai essayé de passer le dtype paramètre read_csv comme dtype={n: pandas.Categorical} mais cela ne fonctionne pas correctement (le résultat est un Objet). le manuel n'est pas clair. ... …
demandé sur 1970-01-01 00:33:35