preguntar acerca de apache-spark-ml

3
réponses

Quelle est la différence entre HashingTF et CountVectorizer dans Spark?

J'essaie de faire la classification doc dans Spark. Je ne suis pas sûr de ce que fait le hachage dans HashingTF; est-ce qu'il sacrifie une quelconque précision? J'en doute, mais je ne sais pas. L'étincelle doc dit qu'il utilise le "hachage truc"... j …
demandé sur 1970-01-01 00:33:36
2
réponses

PySpark: comment convertir Un tableau (i.e. liste) colonne en vecteur

version courte de la question! Considérons le fragment de code suivant (en supposant que spark est déjà fixé à un certain SparkSession): from pyspark.sql import Row source_data = [ Row(city="Chicago", temperatures=[-1.0, -2.0, -3.0]), Row(c …
demandé sur 1970-01-01 00:33:37
2
réponses

Enregistrer le modèle ML pour une utilisation future

j'appliquais des algorithmes D'apprentissage automatique comme la régression linéaire, la régression logistique et Bayes naïve à certaines données, mais j'essayais d'éviter D'utiliser des RDDs et de commencer à utiliser des images de données parce qu …
demandé sur 1970-01-01 00:33:35