preguntar acerca de gensim

2
réponses

word2vec lemmatisation du corpus avant la formation

Word2vec semble être principalement formé sur les données brutes de corpus. Toutefois, la lemmatisation est un prétraitement standard pour de nombreuses tâches de similarité sémantique. Je me demandais si quelqu'un avait de l'expérience dans la lemma …
demandé sur 1970-01-01 00:33:34
2
réponses

Document d’actualité de la distribution dans Gensim LDA

j'ai dérivé un modèle Lda topic en utilisant un corpus jouet comme suit: documents = ['Human machine interface for lab abc computer applications', 'A survey of user opinion of computer system response time', 'The EPS user i …
demandé sur 1970-01-01 00:33:33
4
réponses

Comprendre la mise en œuvre de la LDA à l’aide de gensim

j'essaie de comprendre comment le paquet gensim en Python implémente L'Allocation de Dirichlet latente. Je suis en train de faire le suivant: définir l'ensemble de données documents = ["Apple is releasing a new product", "Amazon sell …
demandé sur 1970-01-01 00:33:33
2
réponses

Python Gensim: comment calculer la similarité des documents à l’aide du modèle LDA?

j'ai un modèle Lda formé et je veux calculer le score de similarité entre deux documents du corpus sur lequel j'ai formé mon modèle. Après avoir étudié tous les tutoriels et fonctions de Gensim, Je n'arrive toujours pas à y voir clair. Quelqu'un peut …
demandé sur 1970-01-01 00:33:34
4
réponses

Comment utiliser Gensim doc2vec avec des vecteurs de mots pré-formés?

j'ai récemment découvert l'ajout de doc2vec à Gensim. Comment puis-je utiliser des vecteurs de mots préformés (par exemple trouvés dans le site Web original de word2vec) avec doc2vec? ou doc2vec obtient-il les vecteurs de mots à partir des mêmes phr …
demandé sur 1970-01-01 00:33:34
5
réponses

Mise à jour du modèle gensim word2vec

j'ai un modèle word2vec dans gensim formé sur 98892 documents. Pour toute phrase donnée qui n'est pas présente dans le tableau de phrases (c.-à-d. l'ensemble sur lequel j'ai formé le modèle), je dois mettre à jour le modèle avec cette phrase de sorte …
demandé sur 1970-01-01 00:33:34
3
réponses

Doc2vec: comment obtenir des vecteurs de documents

comment obtenir les vecteurs de documents de deux documents textuels en utilisant Doc2vec? Je suis nouveau à cela, il serait utile si quelqu'un pouvait me pointer dans la bonne direction/m'aider avec quelques tutoriel j'utilise la bibliothèque gens …
demandé sur 1970-01-01 00:33:35
5
réponses

Comment créer un nuage de mots à partir d’un corpus en Python?

à Partir de la Création d'un sous-ensemble de mots à partir d'un corpus dans la R , le répondeur peut facilement convertir un term-document matrix dans un nuage de mots facilement. est-ce qu'il y a une fonction similaire dans les bibl …
demandé sur 1970-01-01 00:33:33