preguntar acerca de word2vec

2
réponses

Qu’est-ce qu’une couche de projection dans le contexte des réseaux neuronaux?

J'essaie actuellement de comprendre l'architecture derrière l'algorithme word2vec neural net learning, pour représenter les mots en tant que vecteurs en fonction de leur contexte. Après avoir lu papier Tomas Mikolov je suis tombé sur ce qu'il défi …
demandé sur 1970-01-01 00:33:36
3
réponses

Utilisation de Word2Vec pour la modélisation thématique

j'ai lu que la technique la plus courante pour la modélisation de sujets (extraire des sujets possibles du texte) est L'allocation de Dirichlet Latent (LDA). cependant, je suis intéressé si c'est une bonne idée d'essayer la modélisation de sujet ave …
demandé sur 1970-01-01 00:33:35
1
réponses

Utilisation de word2vec préformé avec LSTM pour la génération de mots

LSTM / RNN peut être utilisé pour la génération de texte. montre la façon d'utiliser des embeddings de mot de gant pré-formé pour le modèle Keras. comment utiliser les imbrications de mots Word2Vec préformées avec Keras LSTM modèle? post a aidé. C …
demandé sur 1970-01-01 00:33:37
2
réponses

word2vec lemmatisation du corpus avant la formation

Word2vec semble être principalement formé sur les données brutes de corpus. Toutefois, la lemmatisation est un prétraitement standard pour de nombreuses tâches de similarité sémantique. Je me demandais si quelqu'un avait de l'expérience dans la lemma …
demandé sur 1970-01-01 00:33:34
3
réponses

Comment word2vec ou skip-gram model convertit-il les mots en vecteur?

j'ai lu beaucoup de documents sur la NLP, et je suis tombé sur de nombreux modèles. J'ai obtenu le modèle SVD et je l'ai représenté en 2-D, mais je n'ai toujours pas obtenu comment faire un vecteur de mot en donnant un corpus au modèle word2vec/skip- …
demandé sur 1970-01-01 00:33:35
2
réponses

CBOW v. S. skip-gram: pourquoi inverser le contexte et les mots-cibles?

la page, il est dit que: [...] skip-gram inverse les contextes et les cibles, et tente de prédire chaque mot de contexte à partir de son mot cible [...] Cependant, en regardant l'ensemble de données de formation qu'il produit, le contenu de …
demandé sur 1970-01-01 00:33:36
2
réponses

Extraire les mots les plus importants de L’index Elasticsearch, en utilisant le client Node JS

Inspiré par le texte suivant git et vidéo j'essaie de créer une recherche conceptuelle pour mon domaine, en utilisant word2vec comme synonymes filtre pour mes requêtes. donnant la structure de document suivante: { "_index": "conversations …
demandé sur 1970-01-01 00:33:36
4
réponses

Comment utiliser word2vec pour calculer la distance de similarité en donnant 2 mots

Word2vec est un outil open source pour calculer la distance de mots fournis par Google.Il peut être utilisé en saisissant un mot et en produisant les listes de mots classés selon la similitude. par exemple, Entrée: france Sortie: Wor …
demandé sur 1970-01-01 00:33:34
4
réponses

Comment utiliser Gensim doc2vec avec des vecteurs de mots pré-formés?

j'ai récemment découvert l'ajout de doc2vec à Gensim. Comment puis-je utiliser des vecteurs de mots préformés (par exemple trouvés dans le site Web original de word2vec) avec doc2vec? ou doc2vec obtient-il les vecteurs de mots à partir des mêmes phr …
demandé sur 1970-01-01 00:33:34
5
réponses

Mise à jour du modèle gensim word2vec

j'ai un modèle word2vec dans gensim formé sur 98892 documents. Pour toute phrase donnée qui n'est pas présente dans le tableau de phrases (c.-à-d. l'ensemble sur lequel j'ai formé le modèle), je dois mettre à jour le modèle avec cette phrase de sorte …
demandé sur 1970-01-01 00:33:34