preguntar acerca de dataframe

2
réponses

dply: ordre alphabétique des colonnes en R

si j'ai un grand DF (des centaines et des centaines) colonnes avec des col_names différents distribués au hasard par ordre alphabétique: df.x <- data.frame(2:11, 1:10, rnorm(10)) colnames(df.x) <- c("ID", "string", "delta") Comment est-ce q …
demandé sur 1970-01-01 00:33:35
3
réponses

R: Assignez des étiquettes variables de colonnes de base de données

je suis aux prises avec des étiquettes de données variables.cadre de colonnes. Supposons que j'ai la base de données suivante (qui fait partie d'une base de données beaucoup plus vaste): data <- data.frame(age = c(21, 30, 25, 41, 29, 33), sex = f …
demandé sur 1970-01-01 00:33:34
5
réponses

Pandas: divisez dataframe en plusieurs dataframes par le nombre de lignes

assez nouveau pour les pandas alors sois indulgente avec moi... j'ai un énorme csv avec beaucoup de tables avec beaucoup de rangées. Je voudrais simplement diviser chaque dataframe en 2 si elle contient plus de 10 lignes. si vrai, je voudrais que …
demandé sur 1970-01-01 00:33:34
2
réponses

Comment ajouter simplement un niveau de colonne à une dataframe pandas

disons que j'ai un dataframe qui ressemble à ceci: df = pd.DataFrame(index=list('abcde'), data={'A': range(5), 'B': range(5)}) df Out[92]: A B a 0 0 b 1 1 c 2 2 d 3 3 e 4 4 si je considère que cette dataframe existe déjà, comment p …
demandé sur 1970-01-01 00:33:36
3
réponses

Fusionner deux bases de données Python pandas de longueur différente mais garder toutes les lignes dans la base de données de sortie

j'ai le problème suivant: j'ai deux pandas trames de données de longueur différente contenant des lignes et des colonnes qui ont des valeurs communes et d'autres qui sont différents, comme ceci: df1: df2: Colum …
demandé sur 1970-01-01 00:33:35
1
réponses

Filtre spark DataFrame sur la chaîne contient

j'utilise étincelle 1.3.0 et Spark Avro 1.0.0. Je travaille à partir de l'exemple sur la page de référentiel. Ce code suivant fonctionne bien val df = sqlContext.read.avro("src/test/resources/episodes.avro") df.filter("doctor > 5").write.avr …
demandé sur 1970-01-01 00:33:36
2
réponses

Utiliser.loc avec un MultiIndex dans pandas?

est-ce que quelqu'un sait s'il est possible d'utiliser la base de données?méthode loc pour sélectionner à partir D'un MultiIndex? J'ai la base de données suivante et je voudrais pouvoir accéder aux valeurs situées dans les colonnes 'Dwell', aux indic …
demandé sur 1970-01-01 00:33:34
3
réponses

Comment transformer une base de données en une série de listes?

j'ai eu à faire plusieurs fois et je suis toujours frustré. J'ai un dataframe: df = pd.DataFrame([[1, 2, 3, 4], [5, 6, 7, 8]], ['a', 'b'], ['A', 'B', 'C', 'D']) print df A B C D a 1 2 3 4 b 5 6 7 8 je veux tourner df en: pd.Serie …
demandé sur 1970-01-01 00:33:36
4
réponses

Appliquer plusieurs fonctions à chaque ligne d’une dataframe

chaque fois que je pense comprendre comment travailler avec des vecteurs, ce qui semble être un simple problème me retourne la tête. Beaucoup de lecture et d'essais de différents exemples n'ont pas aidé à cette occasion. Veuillez cuillère à me nourri …
demandé sur 1970-01-01 00:33:31
6
réponses

R Comment puis-je calculer la différence entre les lignes dans une base de données

Voici un exemple simple de mon problème: > df <- data.frame(ID=1:10,Score=4*10:1) > df ID Score 1 1 40 2 2 36 3 3 32 4 4 28 5 5 24 6 6 20 7 7 16 8 8 12 9 9 …
demandé sur 1970-01-01 00:33:33