preguntar acerca de classification
3
réponses
XGBoost XGBClassifier par défaut en Python
je tente d'utiliser xgboosts classifier pour classer certaines données binaires. Quand je fais la chose la plus simple et utilise juste les valeurs par défaut (comme suit)
clf = xgb.XGBClassifier()
metLearn=CalibratedClassifierCV(clf, method='isoton …
demandé sur
1970-01-01 00:33:36
2
réponses
Analyse du Sentiment avec NLTK python pour les phrases utilisant des données d’échantillon ou webservice?
je me lance dans un projet de NLP pour l'analyse du sentiment.
j'ai installé NLTK avec succès pour python (semble être un bon logiciel pour cela). Cependant, j'ai du mal à comprendre comment il peut être utilisé pour accomplir ma tâche.
Voici ma t …
demandé sur
1970-01-01 00:33:30
3
réponses
Comment calculer TF * IDF pour qu’un seul nouveau document soit classé?
j'utilise des vecteurs document-terme pour représenter une collection de documents. J'utilise TF*IDF pour calculer le poids du terme pour chaque vecteur de document. Je pourrais alors utiliser cette matrice pour former un modèle de classification de …
demandé sur
1970-01-01 00:33:34
4
réponses
K Algorithme Du Plus Proche Voisin
peut-être que je suis un peu stupide mais je n'arrive pas à trouver une réponse satisfaisante:
En utilisant L'algorithme KNN, disons k=5. Maintenant j'essaie de classer un objet inconnu en obtenant ses 5 voisins les plus proches. Que faire si, après …
demandé sur
1970-01-01 00:33:31
2
réponses
Comment effectuer une régression logistique en utilisant vowpal wabbit sur un ensemble de données très déséquilibré
j'essaie d'utiliser vowpal wabbit pour la régression logistique. Je ne suis pas sûr si c'est la bonne syntaxe pour le faire
For training, I do
./vw -d ~/Desktop/new_data.txt --passes 20 --binary --cache_file cache.txt -f lr.vw --loss_function logi …
demandé sur
1970-01-01 00:33:34
4
réponses
Traitement des ensembles de données déséquilibrés dans Spark MLlib
je travaille sur un problème de classification binaire particulier avec un ensemble de données fortement déséquilibré, et je me demandais si quelqu'un avait essayé de mettre en œuvre des techniques spécifiques pour traiter les ensembles de données dé …
demandé sur
1970-01-01 00:33:35
2
réponses
régression logistique de sklearn avec classes déséquilibrées
je suis en train de résoudre un problème de classification avec la régression logistique de sklearn en python.
mon problème est général / Générique. J'ai un dataset avec deux classes/résultat (positif/négatif ou 1/0), mais l'ensemble est très désé …
demandé sur
1970-01-01 00:33:33
3
réponses
Scikit-learn train de test split avec les indices
Comment puis-je obtenir les indices originaux des données en utilisant train_test_split()?
Ce que j'ai est le suivant
from sklearn.cross_validation import train_test_split
import numpy as np
data = np.reshape(np.randn(20),(10,2)) # 10 training exam …
demandé sur
1970-01-01 00:33:35
2
réponses
Quelle est la différence entre la rétro-propagation et le réseau neuronal de feed-forward?
Quelle est la différence entre les réseaux neuronaux de rétro-propagation et de feed-forward?
en googlant et en lisant, j'ai trouvé que dans le feed-forward il n'y a que la direction vers l'avant, mais dans la rétro-propagation une fois que nous avo …
demandé sur
1970-01-01 00:33:35
10
réponses
Scikit-apprendre: comment obtenir le vrai positif, le vrai négatif, le faux positif et le faux négatif
je suis nouveau en apprentissage machine et en scikit-learn.
Mon problème:
(Merci de corriger tout type de missconception)
j'ai un ensemble de données qui est un grand JSON, je le récupère et le stocke dans un trainList variable.
je le pré-trai …
demandé sur
1970-01-01 00:33:35