preguntar acerca de pyspark-sql

4
réponses

Convertir la chaîne pyspark au format de date

J'ai un dataframe date pyspark avec une colonne de chaîne au format MM-dd-yyyy et j'essaie de le convertir en une colonne de date. J'ai essayé: df.select(to_date(df.STRING_COLUMN).alias('new_date')).show() Et je reçois une chaîne de nulls. Que …
demandé sur 1970-01-01 00:33:36
3
réponses

Afficher des valeurs de colonne distinctes dans pyspark dataframe: python

s'il vous Plaît suggérer pyspark dataframe alternative pour les Pandas df['col'].unique(). je veux énumérer toutes les valeurs uniques dans une colonne de dataframe de pyspark. pas le chemin de type SQL (registertemplate puis requête SQL pour des …
demandé sur 1970-01-01 00:33:36
1
réponses

py4j.protocole.Py4JJavaError lors de la sélection de la colonne imbriquée dans dataframe en utilisant select statetment

j'essaie d'effectuer une tâche simple dans spark dataframe (python) qui est de créer une nouvelle dataframe en sélectionnant des colonnes spécifiques et des colonnes imbriquées à partir d'une autre dataframe par exemple: df.printSchema() root …
demandé sur 1970-01-01 00:33:36
4
réponses

Comment faire de bons exemples de cadres de données reproductibles Apache Spark

j'ai passé beaucoup de temps à lire quelques questions avec les étiquettes pyspark et spark-dataframe et très souvent je trouve que les affiches ne fournissent pas assez d'information pour vraiment comprendre leur question. Je commente habituell …
demandé sur 1970-01-01 00:33:38