preguntar acerca de topic-modeling

3
réponses

Utilisation de Word2Vec pour la modélisation thématique

j'ai lu que la technique la plus courante pour la modélisation de sujets (extraire des sujets possibles du texte) est L'allocation de Dirichlet Latent (LDA). cependant, je suis intéressé si c'est une bonne idée d'essayer la modélisation de sujet ave …
demandé sur 1970-01-01 00:33:35
4
réponses

Comprendre la mise en œuvre de la LDA à l’aide de gensim

j'essaie de comprendre comment le paquet gensim en Python implémente L'Allocation de Dirichlet latente. Je suis en train de faire le suivant: définir l'ensemble de données documents = ["Apple is releasing a new product", "Amazon sell …
demandé sur 1970-01-01 00:33:33
1
réponses

Modélisation des sujets LDA-formation et mise à l’essai

j'ai lu LDA et je comprends les mathématiques de la façon dont les sujets sont générés quand on introduit une collection de documents. les références disent que LDA est un algorithme qui, étant donné une collection de documents et rien de plus (auc …
demandé sur 1970-01-01 00:33:32
2
réponses

Modèles thématiques: validation croisée avec loglikelihood ou perplexité

je regroupe des documents en utilisant la modélisation thématique. Je dois trouver le nombre optimal de sujets. Donc, j'ai décidé de faire dix fois la validation croisée avec les sujets 10, 20, ...60. j'ai divisé mon corpus en dix lots et mi …
demandé sur 1970-01-01 00:33:34