preguntar acerca de topic-modeling
3
réponses
Utilisation de Word2Vec pour la modélisation thématique
j'ai lu que la technique la plus courante pour la modélisation de sujets (extraire des sujets possibles du texte) est L'allocation de Dirichlet Latent (LDA).
cependant, je suis intéressé si c'est une bonne idée d'essayer la modélisation de sujet ave …
demandé sur
1970-01-01 00:33:35
4
réponses
Comprendre la mise en œuvre de la LDA à l’aide de gensim
j'essaie de comprendre comment le paquet gensim en Python implémente L'Allocation de Dirichlet latente. Je suis en train de faire le suivant:
définir l'ensemble de données
documents = ["Apple is releasing a new product",
"Amazon sell …
demandé sur
1970-01-01 00:33:33
1
réponses
Modélisation des sujets LDA-formation et mise à l’essai
j'ai lu LDA et je comprends les mathématiques de la façon dont les sujets sont générés quand on introduit une collection de documents.
les références disent que LDA est un algorithme qui, étant donné une collection de documents et rien de plus (auc …
demandé sur
1970-01-01 00:33:32
2
réponses
Modèles thématiques: validation croisée avec loglikelihood ou perplexité
je regroupe des documents en utilisant la modélisation thématique. Je dois trouver le nombre optimal de sujets. Donc, j'ai décidé de faire dix fois la validation croisée avec les sujets 10, 20, ...60.
j'ai divisé mon corpus en dix lots et mi …
demandé sur
1970-01-01 00:33:34