preguntar acerca de hierarchical-clustering

2
réponses

Regroupement Basé Sur La Matrice Des Distances

mon objectif est de regrouper les mots en fonction de leur similitude par rapport à un corpus de documents textuels. J'ai calculé la Similarité de Jaccard entre chaque paire de mots. En d'autres termes, j'ai une matrice de distance clairsemée disponi …
demandé sur 1970-01-01 00:33:33
1
réponses

Comment ajuster la longueur des branches du dendrogramme dans matplotlib (comme dans astrodendro)? [Python]

Voici mon tracé résultant ci-dessous mais je voudrais qu'il ressemble aux dendrogrammes tronqués dans astrodendro: il y a aussi un dendrogramme à l'air vraiment cool de ce document que je voudrais recréer matplotlib. ci-Dessous est le code pour …
demandé sur 1970-01-01 00:33:38
5
réponses

Regroupement hiérarchique réparti

existe-il des algorithmes qui peuvent aider avec le clustering hiérarchique? La carte de Google-réduire a seulement un exemple de K-clustering. En cas de regroupement hiérarchique, Je ne suis pas sûr comment il est possible de diviser le travail entr …
demandé sur 1970-01-01 00:33:28
1
réponses

différences de heatmap / clustering par défaut dans R (heatplot versus heatmap.2)?

je compare deux façons de créer des heatmaps avec des dendrogrammes en R, une avec made4heatplot et un gplotsheatmap.2. Les résultats appropriés dépendent de l'analyse, mais j'essaie de comprendre pourquoi les valeurs par défaut sont si différentes, …
demandé sur 1970-01-01 00:33:33
4
réponses

Regroupement du texte avec les distances Levenshtein

j'ai un ensemble (2k - 4k) de petites chaînes (3-6 caractères) et je veux les regrouper. Depuis que j'utilise strings, les réponses précédentes sur Comment fonctionne le clustering (en particulier le clustering String)? , m'a informé que distanc …
demandé sur 1970-01-01 00:33:34