preguntar acerca de data-mining

Question

11

réponses

Quelle est la différence entre la régression linéaire et la régression logistique?

Lorsque nous avons à prédire la valeur d'un catégorique (ou discrètes) résultat nous utilisons régression logistique. Je crois que nous utilisons régression linéaire pour prédire également la valeur d'un résultat compte tenu des valeurs d'entrée. A …

data-mining linear-regression machine-learning

demandé sur 1970-01-01 00:33:32

6

réponses

Comment extraire les mots clés utilisés dans le texte? [fermé]

Comment puis-je extraire des données sur une pile de texte pour obtenir des mots-clés par utilisation? ("Jacob Smith" ou "clôture") Et Existe-t-il un logiciel pour le faire déjà? même semi-automatiquement, et s'il peut filtrer des mots simples comme …

data-mining indexing keyword text

demandé sur 1970-01-01 00:33:29

6

réponses

Implémentation Python de L’algorithme optique (Clustering)

Je cherche une implémentation décente de l'algorithme OPTICS en Python. Je vais l'utiliser pour former des groupes de points basés sur la densité (paires(x,y)). Je cherche quelque chose qui prend des paires (x,y) et génère une liste de clusters, où …

cluster-analysis data-mining machine-learning python

demandé sur 1970-01-01 00:33:31

4

réponses

Détection des valeurs aberrantes dans l’exploration de données [fermé]

j'ai quelques questions concernant la détection des valeurs aberrantes: pouvons-nous trouver des valeurs aberrantes en utilisant k-means et est-ce une bonne approche? Existe-t-il un algorithme de regroupement qui n'accepte aucune entrée de l'utilis …

data-mining outliers svm

demandé sur 1970-01-01 00:33:31

2

réponses

Analyse Matlab-PCA et reconstruction de données multidimensionnelles

j'ai un grand ensemble de données multidimensionnelles(132 dimensions). je suis un débutant dans l'exploration de données et je veux appliquer L'analyse des composants principaux en utilisant Matlab. Cependant, j'ai vu qu'il y a beaucoup de fonctio …

data-mining matlab pca

demandé sur 1970-01-01 00:33:32

3

réponses

De meilleurs documents textuels que TF / idf et cosine similarity?

j'essaie de regrouper le flux Twitter. Je veux mettre chaque tweet à un cluster qui parlent du même sujet. J'ai essayé de regrouper le flux en utilisant un algorithme de regroupement en ligne avec TF/idf et la similarité de cosinus mais j'ai trouvé q …

cluster-analysis data-mining machine-learning text-mining

demandé sur 1970-01-01 00:33:33

5

réponses

Comment effectuer le regroupement K-means sur des données de séries chronologiques?

Comment puis-je faire K-means clustering de données de séries chronologiques? Je comprends comment cela fonctionne lorsque les données d'entrée sont un ensemble de points, mais je ne sais pas comment regrouper une série temporelle avec 1XM, où M est …

cluster-analysis data-mining k-means matlab time-series

demandé sur 1970-01-01 00:33:30

3

réponses

Scikit-Learn: prévoir de nouveaux points avec DBSCAN

j'utilise DBSCAN pour regrouper certaines données en utilisant Scikit-Learn (Python 2.7): from sklearn.cluster import DBSCAN dbscan = DBSCAN(random_state=0) dbscan.fit(X) cependant, j'ai trouvé qu'il n'y avait pas de fonction intégrée (à part "fi …

cluster-analysis data-mining dbscan predict scikit-learn

demandé sur 1970-01-01 00:33:35

4

réponses

Meilleur algorithme de regroupement? (expliquée simplement)

Imaginez le problème suivant: vous avez une base de données contenant environ 20.000 textes dans un tableau appelé "articles" vous voulez connecter les articles apparentés en utilisant un algorithme de regroupement afin d'afficher les articles appa …

algorithm cluster-analysis data-mining text text-mining

demandé sur 1970-01-01 00:33:29

4

réponses

Fonction de coût pour la régression logistique

dans les modèles des moindres carrés, la fonction de coût est définie comme le carré de la différence entre la valeur prévue et la valeur réelle en fonction de l'intrant. quand nous faisons une régression logistique, nous changeons la fonction de co …

data-mining machine-learning regression

demandé sur 1970-01-01 00:33:32

Las etiquetas más populares

preguntar acerca de data-mining