preguntar acerca de dataframe

12
réponses

Niveaux de facteur de baisse dans une trame de données sous-définie

J'ai une trame de données contenant un facteur. Lorsque je crée un sous-ensemble de cette trame de données à l'aide de subset() ou d'une autre fonction d'indexation, une nouvelle trame de données est créée. Cependant, la variable factorielle conser …
demandé sur 1970-01-01 00:33:29
16
réponses

Comment créer des échantillons de test et de formation à partir d’un dataframe avec des pandas?

J'ai un ensemble de données assez volumineux sous la forme d'un dataframe et je me demandais comment je serais capable de diviser le dataframe en deux échantillons aléatoires (80% et 20%) pour la formation et les tests. Merci! ... …
demandé sur 1970-01-01 00:33:34
3
réponses

Convertir le type de colonne DataFrame de string en datetime

Comment puis-je convertir une colonne DataFrame de chaînes (au format JJ/mm/AAAA) en datetimes? ... …
demandé sur 1970-01-01 00:33:33
5
réponses

Comment définir le partitionnement de DataFrame?

J'ai commencé à utiliser Spark SQL et DataFrames dans Spark 1.4.0. Je veux définir un partitionneur personnalisé sur les DataFrames, dans Scala, mais je ne vois pas comment le faire. L'une des tables de données avec lesquelles je travaille contient …
demandé sur 1970-01-01 00:33:35
6
réponses

pandas valeurs uniques plusieurs colonnes

df = pd.DataFrame({'Col1': ['Bob', 'Joe', 'Bill', 'Mary', 'Joe'], 'Col2': ['Joe', 'Steve', 'Bob', 'Bob', 'Steve'], 'Col3': np.random.random(5)}) Quelle est la meilleure façon de retourner les valeurs uniques de …
demandé sur 1970-01-01 00:33:34
3
réponses

Renommer les noms de colonnes d’un DataFrame dans Spark Scala

J'essaie de convertir tous les en-têtes / noms de colonnes d'un DataFrame dans Spark-Scala. maintenant je viens avec code suivant qui ne remplace qu'un seul nom de colonne. for( i <- 0 to origCols.length - 1) { df.withColumnRenamed( df.col …
demandé sur 1970-01-01 00:33:36
4
réponses

pandas DataFrame colonnes mise à l’échelle avec sklearn

J'ai un DataFrame pandas avec des colonnes de type mixte, et je voudrais appliquer min_max_scaler de sklearn à certaines des colonnes. Idéalement, j'aimerais faire ces transformations en place, mais n'avez pas trouvé un moyen de le faire encore. J' …
demandé sur 1970-01-01 00:33:34
3
réponses

Convertir l’heure unix en date lisible dans pandas DataFrame

J'ai un cadre de données avec des temps et des prix unix. Je veux convertir la colonne d'index afin qu'elle s'affiche dans les dates lisibles par l'homme. Donc, par exemple, j'ai" date " comme 1349633705 dans la colonne d'index mais je voudrais qu'il …
demandé sur 1970-01-01 00:33:33
2
réponses

Ajout d’une colonne à un dataframe dans R

J'ai le dataframe suivant(df) start end 1 14379 32094 2 151884 174367 3 438422 449382 4 618123 621256 5 698271 714321 6 973394 975857 7 980508 982372 8 994539 994661 9 1055151 1058824 . . . . . . . . …
demandé sur 1970-01-01 00:33:30
1
réponses

Colonnes non définies sélectionnées lors de la sous-définition du cadre de données

J'ai un cadre de données, str(data) pour en savoir plus sur mon cadre de données, le résultat est le suivant: > str(data) 'data.frame': 153 obs. of 6 variables: $ Ozone : int 41 36 12 18 NA 28 23 19 8 NA ... $ Solar.R: int 190 118 149 313 …
demandé sur 1970-01-01 00:33:33