preguntar acerca de scikit-learn

3
réponses

Scikit-Learn: prévoir de nouveaux points avec DBSCAN

j'utilise DBSCAN pour regrouper certaines données en utilisant Scikit-Learn (Python 2.7): from sklearn.cluster import DBSCAN dbscan = DBSCAN(random_state=0) dbscan.fit(X) cependant, j'ai trouvé qu'il n'y avait pas de fonction intégrée (à part "fi …
demandé sur 1970-01-01 00:33:35
2
réponses

Comment appliquer la standardisation aux SVM dans scikit-learn?

j'utilise la version stable actuelle 0.13 de scikit-learn. J'applique un classificateur de vecteur de support linéaire à certaines données en utilisant la classe sklearn.svm.LinearSVC. Dans le chapitre sur le préprocesseur dans la documentation de s …
demandé sur 1970-01-01 00:33:33
2
réponses

régression logistique de sklearn avec classes déséquilibrées

je suis en train de résoudre un problème de classification avec la régression logistique de sklearn en python. mon problème est général / Générique. J'ai un dataset avec deux classes/résultat (positif/négatif ou 1/0), mais l'ensemble est très désé …
demandé sur 1970-01-01 00:33:33
2
réponses

Pandas dataframe object fonctionnera-t-il avec sklearn kmeans clustering?

l'ensemble de données est pandas dataframe. C'est sklearn.cluster.KMeans km = KMeans(n_clusters = n_Clusters) km.fit(dataset) prediction = km.predict(dataset) C'est ainsi que je décide quelle entité appartient à quel cluster: for i in range …
demandé sur 1970-01-01 00:33:35
3
réponses

Scikit-learn train de test split avec les indices

Comment puis-je obtenir les indices originaux des données en utilisant train_test_split()? Ce que j'ai est le suivant from sklearn.cross_validation import train_test_split import numpy as np data = np.reshape(np.randn(20),(10,2)) # 10 training exam …
demandé sur 1970-01-01 00:33:35
10
réponses

Scikit-apprendre: comment obtenir le vrai positif, le vrai négatif, le faux positif et le faux négatif

je suis nouveau en apprentissage machine et en scikit-learn. Mon problème: (Merci de corriger tout type de missconception) j'ai un ensemble de données qui est un grand JSON, je le récupère et le stocke dans un trainList variable. je le pré-trai …
demandé sur 1970-01-01 00:33:35
3
réponses

Transmission de données catégoriques à L’Arbre de décision Sklearn

import pandas as pd from sklearn.tree import DecisionTreeClassifier data = pd.DataFrame() data['A'] = ['a','a','b','a'] data['B'] = ['b','b','a','b'] data['C'] = [0, 0, 1, 0] data['Class'] = ['n','n','y','n'] tree = DecisionTreeClassifier() tree.fi …
demandé sur 1970-01-01 00:33:36
2
réponses

Python scikit apprendre MLPClassifier » les tailles de la couche cachée»

je suis perdu dans le manuel d'utilisation scikit learn 0.18(http://scikit-learn.org/dev/modules/generated/sklearn.neural_network.MLPClassifier.html#sklearn.neural_network.MLPClassifier): hidden_layer_sizes : tuple, length = n_layers - 2, default …
demandé sur 1970-01-01 00:33:36
2
réponses

Comment obtenir le meilleur estimateur sur GridSearchCV (Random Forest Classifier Scikit)

je lance GridSearch CV pour optimiser les paramètres d'un classificateur dans scikit. Une fois que j'ai fini, j'aimerais savoir quels paramètres ont été choisis comme étant les meilleurs. Chaque fois que je faire si je reçois un AttributeError: 'Ran …
demandé sur 1970-01-01 00:00:00
4
réponses

sklearn-validation croisée avec scores multiples

je voudrais calculer l' rappel,précision et f-mesure d'un test de validation croisée pour différents classificateurs. scikit-learn vient cross_val_score mais malheureusement cette méthode ne renvoie pas de valeurs multiples. j'ai pu calculer de tel …
demandé sur 1970-01-01 00:33:34