preguntar acerca de apache-spark-dataset

2
réponses

Encoder pour les ensembles de données Spark

je voudrais écrire un codeur Ligne tapez un ensemble de données, pour une opération cartographique que je fais. Essentiellement, je ne comprends pas comment écrire les encodeurs. ci-Dessous est un exemple d'une opération de carte: In the example be …
demandé sur 1970-01-01 00:33:37
1
réponses

Effectuer une jointure dactylographiée dans Scala avec les ensembles de données Spark

j'aime les ensembles de données Spark car ils me donnent des erreurs d'analyse et des erreurs de syntaxe au moment de la compilation et me permettent également de travailler avec getters au lieu de noms/nombres codés en dur. La plupart des calculs pe …
demandé sur 1970-01-01 00:33:36
11
réponses

Différence entre DataFrame(dans Spark 2.0 I. e DataSet[Row]) et RDD in Spark

je me demande juste Quelle est la différence entre un RDD et DataFrame (Spark 2.0.0 DataFrame est un simple alias type pour Dataset[Row] ) dans Apache Spark? Pouvez-vous convertir un à l'autre? ... …
demandé sur 1970-01-01 00:33:35
7
réponses

Comment stocker des objets personnalisés dans Dataset?

selon introduisant les données D'étincelles : alors que nous attendons Spark 2.0, nous prévoyons des améliorations intéressantes aux ensembles de données, en particulier: ... Encodeurs personnalisés-alors que nous autorégulon …
demandé sur 1970-01-01 00:33:36
2
réponses

Spark 2.0 Dataset vs DataFrame

à partir de spark 2.0.1 j'ai quelques questions. J'ai lu beaucoup de documentation mais jusqu'à présent je n'ai pas pu trouver de réponses suffisantes: Quelle est la différence entre df.select("foo") df.select($"foo") …
demandé sur 1970-01-01 00:33:36