preguntar acerca de pandas
2
réponses
Comment convertir Spark RDD en pandas dataframe en ipython?
j'ai un RDD et je veux le convertir en pandas dataframe. Je sais que pour convertir et RDD normal dataframe nous pouvons faire
df = rdd1.toDF()
Mais je veux convertir le RDDpandas dataframe et pas normale dataframe. Comment puis-je le faire?
…
demandé sur
1970-01-01 00:33:36
2
réponses
Quelle est la différence entre pandas ACF et statsmodel ACF?
Je calcule la fonction D'autocorrélation pour les retours d'actions. Pour ce faire, j'ai testé deux fonctions, l' autocorr fonction intégrée dans Pandas, et le acf fonction fournie par statsmodels.tsa. Ceci est fait dans le suivant MWE:
import panda …
demandé sur
1970-01-01 00:33:36
4
réponses
Comment résoudre les problèmes de mémoire tout en multiprocessing en utilisant Pool.map()?
j'ai écrit le programme (ci-dessous):
lire un énorme fichier texte pandas dataframe
groupby en utilisant une valeur de colonne spécifique pour séparer les données et les stocker en tant que liste d'images de données.
puis passez les données àmultipr …
demandé sur
1970-01-01 00:33:38
1
réponses
Comment supprimer les parenthèses et toutes les données en utilisant Pandas/Python?
j'ai un dataframe où je veux supprimer toutes les parenthèses et des trucs à l'intérieur.
j'ai vérifié :
Comment puis-je supprimer un texte entre parenthèses avec un regex?
où la réponse pour supprimer les données était
re.sub(r'([^)]*)', '', f …
demandé sur
1970-01-01 00:33:34
2
réponses
matplotlib: tracer plusieurs colonnes de la base de données pandas sur le diagramme à barres
j'utilise le code suivant pour tracer un graphique:
import matplotlib.pyplot as pls
my_df.plot(x='my_timestampe', y='col_A', kind='bar')
plt.show()
L'intrigue fonctionne bien. Cependant, je veux améliorer le graphique en ayant 3 colonnes: 'col_A …
demandé sur
1970-01-01 00:33:37
2
réponses
Faire fondre la matrice triangulaire supérieure D’une base de données Pandas
Donné un carré pandas DataFrame de la forme suivante:
a b c
a 1 .5 .3
b .5 1 .4
c .3 .4 1
Comment puis-je!--2--> seul le triangle supérieur pour obtenir
Row Column Value
a a 1
a b .5
a …
demandé sur
1970-01-01 00:33:35
2
réponses
Moyenne mobile pondérée en python
j'ai des données échantillonnées à intervalles essentiellement aléatoires. Je voudrais calculer une moyenne mobile pondérée en utilisant numpy (ou un autre paquet python). J'ai une implémentation brute d'une moyenne mobile, mais j'ai du mal à trouver …
demandé sur
1970-01-01 00:33:33
3
réponses
Copier toutes les valeurs dans une colonne d’une nouvelle colonne de pandas dataframe
C'est une question très simple, je n'arrive pas à trouver une réponse.
j'ai un dataframe comme celle-ci, appelée df:
A B C
a.1 b.1 c.1
a.2 b.2 c.2
a.3 b.3 c.3
puis j'extrait toutes les lignes de df, où la colonne ' B 'a …
demandé sur
1970-01-01 00:33:35
4
réponses
Regrouper les valeurs des colonnes dans un DF pandas
j'ai un script qui attribue une valeur basée sur deux columns dans un pandasdf. Le code ci-dessous est capable d'implémenter la première étape, mais j'ai du mal avec la seconde.
ainsi le script devrait d'abord:
1) Assigner un Person pour chaque in …
demandé sur
1970-01-01 00:33:38
5
réponses
Python: les Pandas pd.lire excel donnant ImportError: Installer xlrd>= 0.9.0 pour Excel soutien
je suis en train de lire un .xlsx avec pandas, mais avec l'erreur suivante:
data = pd.read_excel(low_memory=False, io="DataAnalysis1/temp1.xlsx").fillna(value=0)
Traceback (most recent call last):
File "/Users/Vineeth/PycharmProjects/DataAnalysi …
demandé sur
1970-01-01 00:33:38