preguntar acerca de dataframe
12
réponses
Niveaux de facteur de baisse dans une trame de données sous-définie
J'ai une trame de données contenant un facteur. Lorsque je crée un sous-ensemble de cette trame de données à l'aide de subset() ou d'une autre fonction d'indexation, une nouvelle trame de données est créée. Cependant, la variable factorielle conser …
demandé sur
1970-01-01 00:33:29
16
réponses
Comment créer des échantillons de test et de formation à partir d’un dataframe avec des pandas?
J'ai un ensemble de données assez volumineux sous la forme d'un dataframe et je me demandais comment je serais capable de diviser le dataframe en deux échantillons aléatoires (80% et 20%) pour la formation et les tests.
Merci! ... …
demandé sur
1970-01-01 00:33:34
3
réponses
Convertir le type de colonne DataFrame de string en datetime
Comment puis-je convertir une colonne DataFrame de chaînes (au format JJ/mm/AAAA) en datetimes? ... …
demandé sur
1970-01-01 00:33:33
5
réponses
Comment définir le partitionnement de DataFrame?
J'ai commencé à utiliser Spark SQL et DataFrames dans Spark 1.4.0. Je veux définir un partitionneur personnalisé sur les DataFrames, dans Scala, mais je ne vois pas comment le faire.
L'une des tables de données avec lesquelles je travaille contient …
demandé sur
1970-01-01 00:33:35
6
réponses
pandas valeurs uniques plusieurs colonnes
df = pd.DataFrame({'Col1': ['Bob', 'Joe', 'Bill', 'Mary', 'Joe'],
'Col2': ['Joe', 'Steve', 'Bob', 'Bob', 'Steve'],
'Col3': np.random.random(5)})
Quelle est la meilleure façon de retourner les valeurs uniques de …
demandé sur
1970-01-01 00:33:34
3
réponses
Renommer les noms de colonnes d’un DataFrame dans Spark Scala
J'essaie de convertir tous les en-têtes / noms de colonnes d'un DataFrame dans Spark-Scala. maintenant je viens avec code suivant qui ne remplace qu'un seul nom de colonne.
for( i <- 0 to origCols.length - 1) {
df.withColumnRenamed(
df.col …
demandé sur
1970-01-01 00:33:36
4
réponses
pandas DataFrame colonnes mise à l’échelle avec sklearn
J'ai un DataFrame pandas avec des colonnes de type mixte, et je voudrais appliquer min_max_scaler de sklearn à certaines des colonnes. Idéalement, j'aimerais faire ces transformations en place, mais n'avez pas trouvé un moyen de le faire encore. J' …
demandé sur
1970-01-01 00:33:34
3
réponses
Convertir l’heure unix en date lisible dans pandas DataFrame
J'ai un cadre de données avec des temps et des prix unix. Je veux convertir la colonne d'index afin qu'elle s'affiche dans les dates lisibles par l'homme. Donc, par exemple, j'ai" date " comme 1349633705 dans la colonne d'index mais je voudrais qu'il …
demandé sur
1970-01-01 00:33:33
2
réponses
Ajout d’une colonne à un dataframe dans R
J'ai le dataframe suivant(df)
start end
1 14379 32094
2 151884 174367
3 438422 449382
4 618123 621256
5 698271 714321
6 973394 975857
7 980508 982372
8 994539 994661
9 1055151 1058824
. . .
. . .
. . …
demandé sur
1970-01-01 00:33:30
1
réponses
Colonnes non définies sélectionnées lors de la sous-définition du cadre de données
J'ai un cadre de données, str(data) pour en savoir plus sur mon cadre de données, le résultat est le suivant:
> str(data)
'data.frame': 153 obs. of 6 variables:
$ Ozone : int 41 36 12 18 NA 28 23 19 8 NA ...
$ Solar.R: int 190 118 149 313 …
demandé sur
1970-01-01 00:33:33