preguntar acerca de dataframe

2
réponses

pandas groupby sans transformer groupé par colonne en index

le comportement par défaut de pandas groupby est de transformer le groupe par colonnes en index et de les supprimer de la liste des colonnes de la dataframe. Par exemple, disons que j'ai une base de données avec ces colonnes col1|col2|col3|col4 s …
demandé sur 1970-01-01 00:33:35
2
réponses

Tronquer la précision de la colonne «TimeStamp» en fonction de l’heure dans la «DataFrame» de pandas

j'ai un pandas.DataFramedf qui a un index généré automatiquement, avec une colonne dt: df['dt'].dtype, df['dt'][0] # (dtype('<M8[ns]'), Timestamp('2014-10-01 10:02:45')) ce que j'aimerais faire, c'est créer une nouvelle colonne tronquée à la pr …
demandé sur 1970-01-01 00:33:35
6
réponses

Strip / trim toutes les ficelles d’une dataframe

nettoyage des valeurs d'un cadre de données multitype en python/pandas, je veux couper les chaînes. Je suis actuellement en train de le faire dans les deux instructions : import pandas as pd df = pd.DataFrame([[' a ', 10], [' c ', 5]]) df.repl …
demandé sur 1970-01-01 00:33:36
2
réponses

Tableau croisé Simple dans les pandas

je suis tombé sur pandas et il semble idéal pour les calculs simples que je voudrais faire. J'ai de l'expérience avec le SAS et je pensais que ça remplacerait le proc freq -- on dirait que ça va s'adapter à ce que je pourrais vouloir faire dans le f …
demandé sur 1970-01-01 00:33:32
3
réponses

Diviser une colonne de chaîne de caractères dataframe en plusieurs colonnes différentes

ce que j'essaie d'accomplir c'est diviser une colonne en plusieurs colonnes. Je préférerais que la première colonne contienne "F", la deuxième colonne "US", la troisième "CA6" ou "DL", et la quatrième "Z13" ou "U13" etc. Mon df entier suit le même …
demandé sur 1970-01-01 00:33:33
7
réponses

Tri pandas dataframe à la fois sur les valeurs d’une colonne et d’un index?

est-il possible de trier les données pandas par les valeurs d'une colonne, mais aussi par index? si vous triez une dataframe de pandas par les valeurs d'une colonne, vous pouvez obtenir la dataframe résultante triée par la colonne, mais malheureusem …
demandé sur 1970-01-01 00:33:33
1
réponses

Filtrage de DataFrame en utilisant la longueur d’une colonne

je veux filtre DataFrame en utilisant une condition liée à la longueur d'une colonne, cette question pourrait être très facile, mais je n'ai pas trouvé de question liée dans le SO. plus précisément, j'ai un DataFrame avec un seul ColumnArrayType(S …
demandé sur 1970-01-01 00:33:35
2
réponses

Utiliser lapply pour appliquer une fonction sur la liste des bases de données et sauvegarder la sortie dans des fichiers avec des noms différents

j'ai une liste de bases de données et j'ai donné à chaque élément de la liste (par exemple, chaque base de données) un nom: e.g. df1 <- data.frame(x = c(1:5), y = c(11:15)) df2 <- data.frame(x = c(1:5), y = c(11:15)) mylist <- list(A …
demandé sur 1970-01-01 00:33:33
2
réponses

mutation de dplyr dans la colonne R-add comme concat de colonnes

j'ai un problème avec l'aide de mutate{dplyr} fonction dans le but d'ajouter une nouvelle colonne à la trame de données. Je veux qu'une nouvelle colonne soit de type caractère et se compose de "concat" de mots triés à partir d'autres colonnes (qui so …
demandé sur 1970-01-01 00:33:34
3
réponses

pandas dataframe multiplier par une série

Quelle est la meilleure façon de multiplier toutes les colonnes D'un Pandas DataFrame par un vecteur colonne stockées dans un Series? J'ai utilisé pour ce faire dans Matlab avec repmat(), qui n'existe pas dans les Pandas. Je peux utiliser np.tile(), …
demandé sur 1970-01-01 00:33:32