Questions sur pandas

28
réponses

Renommer les colonnes dans les pandas

j'ai une base de données utilisant des pandas et des étiquettes de colonne que je dois éditer pour remplacer les étiqu ... j'ai les noms de colonne édités stockés dans une liste, mais je ne sais pas comment remplacer les noms de colonne.
demandé sur 2012-07-05 18:21:15
14
réponses

Comment itérer sur des lignes dans une DataFrame dans Pandas?

j'ai un DataFrame de pandas: import pandas as pd inp = [{'c1':10, 'c2':100}, {'c1':11,'c2':110}, {'c1':12,'c2 ... row in df.iterrows(): mais je ne comprends pas ce qu'est l'objet row et comment je peux travailler avec lui.
demandé sur 2013-05-10 11:04:49
13
réponses

Supprimer la colonne de la base de données pandas en utilisant del DF.nom de la colonne

lors de la suppression d'une colonne dans un DataFrame j'utilise: del df['column_name'] et ça marche tr ... comme vous pouvez accéder à la colonne/série comme df.column_name , Je m'attends à ce que cela fonctionne.
demandé sur 2012-11-16 10:26:40
13
réponses

Flux de travail "données importantes" à l'aide de pandas

j'ai essayé de trouver une réponse à cette question pendant de nombreux mois tout en apprenant les pandas. J'utilise ... e toujours créer de nouvelles colonnes (variables ou caractéristiques dans le langage statistique/machine learning).
demandé sur 2013-01-10 20:20:32
21
réponses

Ajout d'une nouvelle colonne à la base de données existante dans les pandas de Python

j'ai la base de données indexée suivante avec des colonnes nommées et des lignes non - continues: a ... eu le résultat voulu, seulement des erreurs au plus. Comment puis-je ajouter la colonne e à l'exemple ci-dessus?
demandé sur 2012-09-23 23:00:01
11
réponses

Sélection de plusieurs colonnes dans une base de données pandas

j'ai des données dans différentes colonnes mais je ne sais pas comment les extraire pour les sauvegarder dans une autr ... df1 = df['a':'b'] df1 = df.ix[:, 'a':'b'] Aucun ne semble fonctionner. (Modification Mineure)
demandé sur 2012-07-02 01:03:16
26
réponses

Comment changer l'ordre des colonnes de DataFrame?

j'ai le suivant DataFrame ( df ): import numpy as np import pandas as pd df = pd.DataFrame(np.random.rand( ... lonne mean à l'avant, c'est à dire définir comme première colonne de quitter l'ordre des autres colonnes intactes?
demandé sur 2012-10-31 02:22:59
1
réponses

Utilisez une liste de valeurs pour sélectionner des lignes à partir d'une base de données pandas [dupliquer]

Double Possible: comment filtrer le dataframe lignes de pandas par "dans"/"en"? ... ur une liste de valeurs? - quelque chose comme ceci: list_of_values = [3,6] y = df[df['A'] in list_of_values]
demandé sur 2012-08-23 20:31:12
4
réponses

Comment gérer la mise en place D'un système D'alerte rapide dans les Pandas?

arrière-plan je viens de mettre à jour mes Pandas de 0.11 à 0.13.0rc1. Maintenant, l'application affiche beau ... loc[row_index,col_indexer] = value instead quote_df['TDate'] = quote_df.TDate.map(lambda x: x[0:4]+x[5:7]+x[8:10])
demandé sur 0000-00-00 00:00:00
7
réponses

Filtre dataframe lignes si la valeur dans la colonne est dans une liste de valeurs

j'ai une DataFrame Python pandas rpt : rpt <class 'pandas.core.frame.DataFrame'> MultiIndex: 47518 entri ... not works in pandas puisque pandas n'accepte pas au-dessus du commandement, comment atteindre l'objectif?
demandé sur 2012-08-22 07:16:56
8
réponses

Différence entre les méthodes map, applymap et apply dans les Pandas

pouvez-vous me dire quand utiliser ces méthodes de vectorisation avec des exemples de base? je vois que map e ... quer une fonction à une base de données? Encore une fois, des exemples simples qui illustrent l'usage serait génial!
demandé sur 2013-11-06 00:20:14
9
réponses

Pretty-print toute une série de Pandas / DataFrame

je travaille beaucoup avec les séries et les DataFrames sur le terminal. La valeur par défaut __repr__ pour une séri ... rié, peut-être les frontières entre les colonnes, et peut-être même la couleur-codage pour les différentes colonnes.
demandé sur 2013-10-01 23:46:07
12
réponses

Comment vérifier si une valeur est NaN dans une DataFrame Pandas

en Python Pandas, Quelle est la meilleure façon de vérifier si une DataFrame a une (ou plusieurs) valeurs NaN? ... e de données de booléens pour chaque élément. ce post ici même ne répond pas exactement à ma question non plus.
demandé sur 2015-04-09 08:09:39
6
réponses

Sélection d'une ligne de la série pandas/dataframe par index entier

je suis curieux de savoir pourquoi df[2] n'est pas supporté, alors que df.ix[2] et df[2:3] fonctionnent tous les deux. ... ec la convention d'indexation Python. Y a-t-il une raison de ne pas prendre en charge l'indexation ligne par entier?
demandé sur 2013-04-19 07:14:00
9
réponses

Comment puis-je remplacer toutes les valeurs NaN par zéro dans une colonne d'une base de données pandas

j'ai une base de données comme ci-dessous itm Date Amount 67 420 2012-09-30 00:00:00 ... que j'ai essayées n'ont pas fonctionné ou ne reconnaissent pas NaN. Toute suggestion ou solution serait appréciée.
demandé sur 2012-11-08 22:50:39
10
réponses

Quel est le moyen le plus efficace de passer à travers les dataframes avec pandas?

je veux effectuer mes propres opérations complexes sur des données financières dans des images de données d'une manièr ... n générateur pour être efficace en mémoire)? df.iteritems n'est malheureusement itératif que colonne par colonne.
demandé sur 2011-10-20 18:46:14
12
réponses

Définir la valeur pour une cellule particulière dans le DataFrame de pandas en utilisant l'index

J'ai créé une base de données pandas df=DataFrame(index=['A','B','C'], columns=['x','y']) et a ob ... e contenu de df n'a pas changé. C'est encore une fois seule Nan est dans dataframe. des suggestions?
demandé sur 2012-12-12 18:40:45
14
réponses

pandas: filtrer les lignes de DataFrame avec chaînage de l'opérateur

la plupart des opérations dans pandas peuvent être effectuées avec l'opérateur chaînage ( groupby , aggregate , ... . Est-il quelque chose de plus semblable à la suivante? df_filtered = df.mask(lambda x: x['column'] == value)
demandé sur 2012-08-08 21:25:37
12
réponses

Conversion entre datetime, Timestamp et datetime64

comment convertir un objet numpy.datetime64 en un objet datetime.datetime (ou Timestamp )? dans le code suiva ... 00') qui devrait être datetime.datetime(2002, 6, 28, 1, 0) , et pas un long (!) ( 1025222400000000000L )...
demandé sur 2012-12-04 17:08:29
8
réponses

Comment stocker une dataframe en utilisant Pandas

en ce moment, j'importe un assez grand CSV comme dataframe à chaque fois que j'exécute le script. Y a-t-il une bonne s ... onible entre les différentes versions, pour que je n'aie pas à passer tout ce temps à attendre que le script tourne?
demandé sur 2013-06-14 03:05:36
6
réponses

Combiner deux séries en une base de données dans pandas

j'ai deux séries s1 et s2 avec les mêmes indices (non consécutifs). Comment puis-je combiner s1 et s2 pour être deux colonnes dans une base de données et garder un des indices comme une troisième colonne?
demandé sur 2013-08-05 19:37:39
4
réponses

UnicodeDecodeError lors de la lecture D'un fichier CSV dans Pandas avec Python

j'exécute un programme qui traite 30 000 fichiers similaires. Un nombre aléatoire d'entre eux s'arrêtent et produisent ... fichiers vient Toutes du même endroit. Quelle est la meilleure façon de corriger cela pour procéder à l'importation?
demandé sur 2013-08-11 16:06:25
7
réponses

Shuffle DataFrame rows

j'ai la base de données suivante: Col1 Col2 Col3 Type 0 1 2 3 1 1 4 5 6 ... is pas si je vais expliquer cela clairement. Prévenez-moi si Je ne le fais pas. Comment puis-je y parvenir?
demandé sur 2015-04-11 12:47:57
1
réponses

Comment pivoter une base de données

qu'est-ce que le pivot? comment pivoter? est-ce un pivot? format long à format large? ... 1 1 row2 1 0 2 1 2 row3 0 1 0 2 0 row4 0 1 2 2 1
demandé sur 2017-11-07 11:00:28
3
réponses

Quelles sont les différences entre Pandas et NumPy+SciPy en Python? [fermé]

ils semblent tous les deux excessivement similaires et je suis curieux de savoir quel paquet serait plus bénéfique pour l'analyse des données financières.
demandé sur 2012-06-18 08:45:48
5
réponses

Comment mettre en œuvre " in " et "not in" pour Pandas dataframe

Comment puis-je obtenir les équivalents de IN et NOT IN de SQL ? j'ai une liste avec les valeurs nécessai ... ) not_in = not_in[pd.isnull(not_in['matched'])] mais ça ressemble à un horrible kludge. Peut-on l'améliorer?
demandé sur 2013-11-13 21:11:07
12
réponses

Python Pandas - comment aplatir un index hiérarchique en colonnes

j'ai un bloc de données avec un index hiérarchique dans l'axe 1 (colonnes) (à partir d'un groupby.apa fonctionnement): ... 969, 3: 3.9199999999999982, 4: 10.940000000000001}, ('year', ''): {0: 1993, 1: 1993, 2: 1993, 3: 1993, 4: 1993}}
demandé sur 2013-01-24 22:03:11
12
réponses

Construire une DataFrame de pandas à partir des valeurs des variables donne "ValueError: si vous utilisez toutes les valeurs scalaires, vous devez passer un index"

C'est peut-être une question simple, mais je ne sais pas comment faire. Disons que j'ai deux variables comme suit. ... essayé aussi: df2 = (pd.DataFrame({'a':a,'b':b})).reset_index() Cela donne le même message d'erreur.
demandé sur 2013-07-24 20:40:24
7
réponses

Valeurs de Remap dans la colonne pandas avec un dict

j'ai un dictionnaire qui ressemble à ceci: di = {1: "A", 2: "B"} je voudrais l'appliquer à la colonne" col1 ... ermes relatifs à cela ne me montre des liens sur la façon de faire des colonnes à partir de dicts et vice-versa: - /
demandé sur 2013-11-27 22:56:58
3
réponses

Compte de Pandas (distinct) équivalent

j'utilise pandas comme un substitut de db car j'ai plusieurs bases de données (oracle, mssql, etc) et je suis incapabl ... et le résultat serait 201301 5000 201302 13245 Comment puis-je faire cela les pandas?
demandé sur 2013-03-14 17:50:03