preguntar acerca de nlp

3
réponses

Utilisation de Word2Vec pour la modélisation thématique

j'ai lu que la technique la plus courante pour la modélisation de sujets (extraire des sujets possibles du texte) est L'allocation de Dirichlet Latent (LDA). cependant, je suis intéressé si c'est une bonne idée d'essayer la modélisation de sujet ave …
demandé sur 1970-01-01 00:33:35
5
réponses

Comment utiliser NLTK pour générer des phrases à partir d’une grammaire induite?

j'ai une (grande) liste de phrases analysées (qui ont été analysées en utilisant le Stanford parser), par exemple, la phrase "Maintenant, vous pouvez être divertis" a l'arbre suivant: (ROOT (S (ADVP (RB Now)) (, ,) (NP (PRP you)) ( …
demandé sur 1970-01-01 00:33:33
1
réponses

Comment utiliser l’interface python de Stanford NER (nommé entité recogniser)?

Je veux utiliser Stanford NER en python en utilisant la bibliothèque pyner. Voici un extrait de code. import ner tagger = ner.HttpNER(host='localhost', port=80) tagger.get_entities("University of California is located in California, United States") …
demandé sur 1970-01-01 00:33:33
2
réponses

word2vec lemmatisation du corpus avant la formation

Word2vec semble être principalement formé sur les données brutes de corpus. Toutefois, la lemmatisation est un prétraitement standard pour de nombreuses tâches de similarité sémantique. Je me demandais si quelqu'un avait de l'expérience dans la lemma …
demandé sur 1970-01-01 00:33:34
3
réponses

Comment word2vec ou skip-gram model convertit-il les mots en vecteur?

j'ai lu beaucoup de documents sur la NLP, et je suis tombé sur de nombreux modèles. J'ai obtenu le modèle SVD et je l'ai représenté en 2-D, mais je n'ai toujours pas obtenu comment faire un vecteur de mot en donnant un corpus au modèle word2vec/skip- …
demandé sur 1970-01-01 00:33:35
2
réponses

N-grammes: explication + 2 applications

je veux implémenter quelques applications avec n-grammes (de préférence en PHP). quel type de n-grammes est le plus adéquat pour la plupart des utilisations? Un niveau de mot ou un niveau de caractère n-gram? Comment Pouvez-vous implémenter un n-g …
demandé sur 1970-01-01 00:33:29
2
réponses

Analyse du Sentiment avec NLTK python pour les phrases utilisant des données d’échantillon ou webservice?

je me lance dans un projet de NLP pour l'analyse du sentiment. j'ai installé NLTK avec succès pour python (semble être un bon logiciel pour cela). Cependant, j'ai du mal à comprendre comment il peut être utilisé pour accomplir ma tâche. Voici ma t …
demandé sur 1970-01-01 00:33:30
3
réponses

Précision: ANNIE vs Stanford NLP vs OpenNLP avec UIMA

mon travail prévoit d'utiliser un cluster UIMA pour exécuter des documents afin d'extraire des entités nommées et ce qui ne l'est pas. D'après ce que j'ai compris, UIMA ne contient que très peu de composants NLP. Je teste GATE depuis un moment main …
demandé sur 1970-01-01 00:33:33
6
réponses

Algorithme pour la négation des phrases

je me demandais si quelqu'un connaissait les tentatives de négation de phrases algorithmiques. par exemple, si l'on donne une phrase comme "ce livre est bon", fournir un certain nombre de phrases alternatives qui signifient le contraire comme "ce li …
demandé sur 1970-01-01 00:33:30
2
réponses

CBOW v. S. skip-gram: pourquoi inverser le contexte et les mots-cibles?

la page, il est dit que: [...] skip-gram inverse les contextes et les cibles, et tente de prédire chaque mot de contexte à partir de son mot cible [...] Cependant, en regardant l'ensemble de données de formation qu'il produit, le contenu de …
demandé sur 1970-01-01 00:33:36