preguntar acerca de classification

3
réponses

XGBoost XGBClassifier par défaut en Python

je tente d'utiliser xgboosts classifier pour classer certaines données binaires. Quand je fais la chose la plus simple et utilise juste les valeurs par défaut (comme suit) clf = xgb.XGBClassifier() metLearn=CalibratedClassifierCV(clf, method='isoton …
demandé sur 1970-01-01 00:33:36
2
réponses

Analyse du Sentiment avec NLTK python pour les phrases utilisant des données d’échantillon ou webservice?

je me lance dans un projet de NLP pour l'analyse du sentiment. j'ai installé NLTK avec succès pour python (semble être un bon logiciel pour cela). Cependant, j'ai du mal à comprendre comment il peut être utilisé pour accomplir ma tâche. Voici ma t …
demandé sur 1970-01-01 00:33:30
3
réponses

Comment calculer TF * IDF pour qu’un seul nouveau document soit classé?

j'utilise des vecteurs document-terme pour représenter une collection de documents. J'utilise TF*IDF pour calculer le poids du terme pour chaque vecteur de document. Je pourrais alors utiliser cette matrice pour former un modèle de classification de …
demandé sur 1970-01-01 00:33:34
4
réponses

K Algorithme Du Plus Proche Voisin

peut-être que je suis un peu stupide mais je n'arrive pas à trouver une réponse satisfaisante: En utilisant L'algorithme KNN, disons k=5. Maintenant j'essaie de classer un objet inconnu en obtenant ses 5 voisins les plus proches. Que faire si, après …
demandé sur 1970-01-01 00:33:31
2
réponses

Comment effectuer une régression logistique en utilisant vowpal wabbit sur un ensemble de données très déséquilibré

j'essaie d'utiliser vowpal wabbit pour la régression logistique. Je ne suis pas sûr si c'est la bonne syntaxe pour le faire For training, I do ./vw -d ~/Desktop/new_data.txt --passes 20 --binary --cache_file cache.txt -f lr.vw --loss_function logi …
demandé sur 1970-01-01 00:33:34
4
réponses

Traitement des ensembles de données déséquilibrés dans Spark MLlib

je travaille sur un problème de classification binaire particulier avec un ensemble de données fortement déséquilibré, et je me demandais si quelqu'un avait essayé de mettre en œuvre des techniques spécifiques pour traiter les ensembles de données dé …
demandé sur 1970-01-01 00:33:35
2
réponses

régression logistique de sklearn avec classes déséquilibrées

je suis en train de résoudre un problème de classification avec la régression logistique de sklearn en python. mon problème est général / Générique. J'ai un dataset avec deux classes/résultat (positif/négatif ou 1/0), mais l'ensemble est très désé …
demandé sur 1970-01-01 00:33:33
3
réponses

Scikit-learn train de test split avec les indices

Comment puis-je obtenir les indices originaux des données en utilisant train_test_split()? Ce que j'ai est le suivant from sklearn.cross_validation import train_test_split import numpy as np data = np.reshape(np.randn(20),(10,2)) # 10 training exam …
demandé sur 1970-01-01 00:33:35
2
réponses

Quelle est la différence entre la rétro-propagation et le réseau neuronal de feed-forward?

Quelle est la différence entre les réseaux neuronaux de rétro-propagation et de feed-forward? en googlant et en lisant, j'ai trouvé que dans le feed-forward il n'y a que la direction vers l'avant, mais dans la rétro-propagation une fois que nous avo …
demandé sur 1970-01-01 00:33:35
10
réponses

Scikit-apprendre: comment obtenir le vrai positif, le vrai négatif, le faux positif et le faux négatif

je suis nouveau en apprentissage machine et en scikit-learn. Mon problème: (Merci de corriger tout type de missconception) j'ai un ensemble de données qui est un grand JSON, je le récupère et le stocke dans un trainList variable. je le pré-trai …
demandé sur 1970-01-01 00:33:35