preguntar acerca de dataframe
2
réponses
dply: ordre alphabétique des colonnes en R
si j'ai un grand DF (des centaines et des centaines) colonnes avec des col_names différents distribués au hasard par ordre alphabétique:
df.x <- data.frame(2:11, 1:10, rnorm(10))
colnames(df.x) <- c("ID", "string", "delta")
Comment est-ce q …
demandé sur
1970-01-01 00:33:35
3
réponses
R: Assignez des étiquettes variables de colonnes de base de données
je suis aux prises avec des étiquettes de données variables.cadre de colonnes. Supposons que j'ai la base de données suivante (qui fait partie d'une base de données beaucoup plus vaste):
data <- data.frame(age = c(21, 30, 25, 41, 29, 33), sex = f …
demandé sur
1970-01-01 00:33:34
5
réponses
Pandas: divisez dataframe en plusieurs dataframes par le nombre de lignes
assez nouveau pour les pandas alors sois indulgente avec moi...
j'ai un énorme csv avec beaucoup de tables avec beaucoup de rangées. Je voudrais simplement diviser chaque dataframe en 2 si elle contient plus de 10 lignes.
si vrai, je voudrais que …
demandé sur
1970-01-01 00:33:34
2
réponses
Comment ajouter simplement un niveau de colonne à une dataframe pandas
disons que j'ai un dataframe qui ressemble à ceci:
df = pd.DataFrame(index=list('abcde'), data={'A': range(5), 'B': range(5)})
df
Out[92]:
A B
a 0 0
b 1 1
c 2 2
d 3 3
e 4 4
si je considère que cette dataframe existe déjà, comment p …
demandé sur
1970-01-01 00:33:36
3
réponses
Fusionner deux bases de données Python pandas de longueur différente mais garder toutes les lignes dans la base de données de sortie
j'ai le problème suivant: j'ai deux pandas trames de données de longueur différente contenant des lignes et des colonnes qui ont des valeurs communes et d'autres qui sont différents, comme ceci:
df1: df2:
Colum …
demandé sur
1970-01-01 00:33:35
1
réponses
Filtre spark DataFrame sur la chaîne contient
j'utilise étincelle 1.3.0 et Spark Avro 1.0.0.
Je travaille à partir de l'exemple sur la page de référentiel. Ce code suivant fonctionne bien
val df = sqlContext.read.avro("src/test/resources/episodes.avro")
df.filter("doctor > 5").write.avr …
demandé sur
1970-01-01 00:33:36
2
réponses
Utiliser.loc avec un MultiIndex dans pandas?
est-ce que quelqu'un sait s'il est possible d'utiliser la base de données?méthode loc pour sélectionner à partir D'un MultiIndex? J'ai la base de données suivante et je voudrais pouvoir accéder aux valeurs situées dans les colonnes 'Dwell', aux indic …
demandé sur
1970-01-01 00:33:34
3
réponses
Comment transformer une base de données en une série de listes?
j'ai eu à faire plusieurs fois et je suis toujours frustré. J'ai un dataframe:
df = pd.DataFrame([[1, 2, 3, 4], [5, 6, 7, 8]], ['a', 'b'], ['A', 'B', 'C', 'D'])
print df
A B C D
a 1 2 3 4
b 5 6 7 8
je veux tourner df en:
pd.Serie …
demandé sur
1970-01-01 00:33:36
4
réponses
Appliquer plusieurs fonctions à chaque ligne d’une dataframe
chaque fois que je pense comprendre comment travailler avec des vecteurs, ce qui semble être un simple problème me retourne la tête. Beaucoup de lecture et d'essais de différents exemples n'ont pas aidé à cette occasion. Veuillez cuillère à me nourri …
demandé sur
1970-01-01 00:33:31
6
réponses
R Comment puis-je calculer la différence entre les lignes dans une base de données
Voici un exemple simple de mon problème:
> df <- data.frame(ID=1:10,Score=4*10:1)
> df
ID Score
1 1 40
2 2 36
3 3 32
4 4 28
5 5 24
6 6 20
7 7 16
8 8 12
9 9 …
demandé sur
1970-01-01 00:33:33