preguntar acerca de apache-spark-ml
3
réponses
Quelle est la différence entre HashingTF et CountVectorizer dans Spark?
J'essaie de faire la classification doc dans Spark. Je ne suis pas sûr de ce que fait le hachage dans HashingTF; est-ce qu'il sacrifie une quelconque précision? J'en doute, mais je ne sais pas. L'étincelle doc dit qu'il utilise le "hachage truc"... j …
demandé sur
1970-01-01 00:33:36
2
réponses
PySpark: comment convertir Un tableau (i.e. liste) colonne en vecteur
version courte de la question!
Considérons le fragment de code suivant (en supposant que spark est déjà fixé à un certain SparkSession):
from pyspark.sql import Row
source_data = [
Row(city="Chicago", temperatures=[-1.0, -2.0, -3.0]),
Row(c …
demandé sur
1970-01-01 00:33:37
2
réponses
Enregistrer le modèle ML pour une utilisation future
j'appliquais des algorithmes D'apprentissage automatique comme la régression linéaire, la régression logistique et Bayes naïve à certaines données, mais j'essayais d'éviter D'utiliser des RDDs et de commencer à utiliser des images de données parce qu …
demandé sur
1970-01-01 00:33:35