preguntar acerca de pandas

2
réponses

Comment convertir Spark RDD en pandas dataframe en ipython?

j'ai un RDD et je veux le convertir en pandas dataframe. Je sais que pour convertir et RDD normal dataframe nous pouvons faire df = rdd1.toDF() Mais je veux convertir le RDDpandas dataframe et pas normale dataframe. Comment puis-je le faire? …
demandé sur 1970-01-01 00:33:36
2
réponses

Quelle est la différence entre pandas ACF et statsmodel ACF?

Je calcule la fonction D'autocorrélation pour les retours d'actions. Pour ce faire, j'ai testé deux fonctions, l' autocorr fonction intégrée dans Pandas, et le acf fonction fournie par statsmodels.tsa. Ceci est fait dans le suivant MWE: import panda …
demandé sur 1970-01-01 00:33:36
4
réponses

Comment résoudre les problèmes de mémoire tout en multiprocessing en utilisant Pool.map()?

j'ai écrit le programme (ci-dessous): lire un énorme fichier texte pandas dataframe groupby en utilisant une valeur de colonne spécifique pour séparer les données et les stocker en tant que liste d'images de données. puis passez les données àmultipr …
demandé sur 1970-01-01 00:33:38
1
réponses

Comment supprimer les parenthèses et toutes les données en utilisant Pandas/Python?

j'ai un dataframe où je veux supprimer toutes les parenthèses et des trucs à l'intérieur. j'ai vérifié : Comment puis-je supprimer un texte entre parenthèses avec un regex? où la réponse pour supprimer les données était re.sub(r'([^)]*)', '', f …
demandé sur 1970-01-01 00:33:34
2
réponses

matplotlib: tracer plusieurs colonnes de la base de données pandas sur le diagramme à barres

j'utilise le code suivant pour tracer un graphique: import matplotlib.pyplot as pls my_df.plot(x='my_timestampe', y='col_A', kind='bar') plt.show() L'intrigue fonctionne bien. Cependant, je veux améliorer le graphique en ayant 3 colonnes: 'col_A …
demandé sur 1970-01-01 00:33:37
2
réponses

Faire fondre la matrice triangulaire supérieure D’une base de données Pandas

Donné un carré pandas DataFrame de la forme suivante: a b c a 1 .5 .3 b .5 1 .4 c .3 .4 1 Comment puis-je!--2--> seul le triangle supérieur pour obtenir Row Column Value a a 1 a b .5 a …
demandé sur 1970-01-01 00:33:35
2
réponses

Moyenne mobile pondérée en python

j'ai des données échantillonnées à intervalles essentiellement aléatoires. Je voudrais calculer une moyenne mobile pondérée en utilisant numpy (ou un autre paquet python). J'ai une implémentation brute d'une moyenne mobile, mais j'ai du mal à trouver …
demandé sur 1970-01-01 00:33:33
3
réponses

Copier toutes les valeurs dans une colonne d’une nouvelle colonne de pandas dataframe

C'est une question très simple, je n'arrive pas à trouver une réponse. j'ai un dataframe comme celle-ci, appelée df: A B C a.1 b.1 c.1 a.2 b.2 c.2 a.3 b.3 c.3 puis j'extrait toutes les lignes de df, où la colonne ' B 'a …
demandé sur 1970-01-01 00:33:35
4
réponses

Regrouper les valeurs des colonnes dans un DF pandas

j'ai un script qui attribue une valeur basée sur deux columns dans un pandasdf. Le code ci-dessous est capable d'implémenter la première étape, mais j'ai du mal avec la seconde. ainsi le script devrait d'abord: 1) Assigner un Person pour chaque in …
demandé sur 1970-01-01 00:33:38
5
réponses

Python: les Pandas pd.lire excel donnant ImportError: Installer xlrd>= 0.9.0 pour Excel soutien

je suis en train de lire un .xlsx avec pandas, mais avec l'erreur suivante: data = pd.read_excel(low_memory=False, io="DataAnalysis1/temp1.xlsx").fillna(value=0) Traceback (most recent call last): File "/Users/Vineeth/PycharmProjects/DataAnalysi …
demandé sur 1970-01-01 00:33:38