preguntar acerca de pandas

1
réponses

Comment réaliser plusieurs DataFrames pandas en une seule dataframe dask plus grande que la mémoire?

j'analyse des données délimitées par tabulations pour créer des données tabulaires, que j'aimerais stocker dans un HDF5. mon problème est que je dois regrouper les données dans un format, puis les transférer dans HDF5. Il s'agit de données de taill …
demandé sur 1970-01-01 00:33:36
2
réponses

Les Pandas de df.parallélisation iterrow()

for row in df.iterrow(): idx = row[0] k = row[1]['Chromosome'] start,end = row[1]['Bin'].split('-') sequence = sequence_from_coordinates(k,1,start,end) #slow download form http df.set_value(idx,'GC%',gc_content(sequence,percent= …
demandé sur 1970-01-01 00:33:36
2
réponses

Groupe De Corrélation De Pandas

en supposant que j'ai une base de données similaire à celle ci-dessous, Comment puis-je obtenir la corrélation entre 2 colonnes spécifiques et ensuite Grouper par la colonne 'ID'? Je crois que la méthode "corr" de Pandas trouve la corrélation entre …
demandé sur 1970-01-01 00:33:35
3
réponses

Comment utiliser les DataFrames pandas et les tableaux numpy dans Rpy2?

j'aimerais utiliser pandas pour toute mon analyse avec numpy mais utiliser Rpy2 pour tracer mes données. Je veux faire toutes les analyses en utilisant des bases de données pandas et ensuite utiliser le tracé complet de R via rpy2 pour tracer ceux-ci …
demandé sur 1970-01-01 00:33:33
3
réponses

Python pandas groupby globale sur plusieurs colonnes, puis faites pivoter

en Python, j'ai une DataFrame de pandas similaire à la suivante: Item | shop1 | shop2 | shop3 | Category ------------------------------------ Shoes| 45 | 50 | 53 | Clothes TV | 200 | 300 | 250 | Technology Book | 20 | 17 | 21 …
demandé sur 1970-01-01 00:33:37
5
réponses

Pandas groupby avec des catégories avec des Nan redondantes

j'ai des problèmes avec pandas groupby avec des données nominales. Théoriquement, il devrait être super efficace: vous groupez et indexez via des entiers plutôt que des chaînes. Mais il insiste sur le fait que, en regroupant par catégories multiples …
demandé sur 1970-01-01 00:33:38
1
réponses

La façon la plus facile de créer un gradient de couleur sur excel en utilisant python/pandas?

J'ai donc des données que j'envoie dans un fichier excel en utilisant L'ExcelWriter de pandas. Une fois que toutes les données sont sorties dans le fichier Excel, Quelle est la façon la plus facile d'appliquer le formatage conditionnel à Python? j …
demandé sur 1970-01-01 00:33:34
3
réponses

Python Pandas-Understanding inplace=True

Dans le pandas bibliothèque plusieurs fois il y a une option pour changer l'objet inplace comme avec la déclaration suivante... df.dropna(axis='index', how='all', inplace=True) je suis curieux de savoir ce qui est retourné ainsi que comment l'obj …
demandé sur 1970-01-01 00:33:37
1
réponses

Pandas: Obtenir de l’étiquette de valeur dans la Série de l’Objet

Comment est-il possible de récupérer le labe d'une valeur particulière dans un objet de la série pandas: Par exemple: labels = ['a', 'b', 'c', 'd', 'e'] s = Series (arange(5) * 4 , labels) Qui produit la Série: a 0 b 4 c 8 d 12 e …
demandé sur 1970-01-01 00:33:33
1
réponses

Py Pandas.format(dataframe)

en tant que débutant de Python j'ai récemment découvert qu'avec Py 2.7 je peux faire quelque chose comme: print '{:20,.2f}'.format(123456789) qui donnera la sortie résultante: 123,456,789.00 je cherche maintenant à avoir un résultat similaire …
demandé sur 1970-01-01 00:33:33