preguntar acerca de pyspark-sql
4
réponses
Convertir la chaîne pyspark au format de date
J'ai un dataframe date pyspark avec une colonne de chaîne au format MM-dd-yyyy et j'essaie de le convertir en une colonne de date.
J'ai essayé:
df.select(to_date(df.STRING_COLUMN).alias('new_date')).show()
Et je reçois une chaîne de nulls. Que …
demandé sur
1970-01-01 00:33:36
3
réponses
Afficher des valeurs de colonne distinctes dans pyspark dataframe: python
s'il vous Plaît suggérer pyspark dataframe alternative pour les Pandas df['col'].unique().
je veux énumérer toutes les valeurs uniques dans une colonne de dataframe de pyspark.
pas le chemin de type SQL (registertemplate puis requête SQL pour des …
demandé sur
1970-01-01 00:33:36
1
réponses
py4j.protocole.Py4JJavaError lors de la sélection de la colonne imbriquée dans dataframe en utilisant select statetment
j'essaie d'effectuer une tâche simple dans spark dataframe (python) qui est de créer une nouvelle dataframe en sélectionnant des colonnes spécifiques et des colonnes imbriquées à partir d'une autre dataframe
par exemple:
df.printSchema()
root
…
demandé sur
1970-01-01 00:33:36
4
réponses
Comment faire de bons exemples de cadres de données reproductibles Apache Spark
j'ai passé beaucoup de temps à lire quelques questions avec les étiquettes pyspark et spark-dataframe et très souvent je trouve que les affiches ne fournissent pas assez d'information pour vraiment comprendre leur question. Je commente habituell …
demandé sur
1970-01-01 00:33:38