preguntar acerca de nlp
3
réponses
Algorithmes de reconnaissance de formes dans le noeud.js ou PHP?
je voudrais commencer à expérimenter avec des algorithmes qui reconnaissent les modèles dans les données. Je traite avec de nombreux types de séquences (les pixels de l'image, la saisie de texte, les mouvements de l'utilisateur), et qu'il serait amus …
demandé sur
1970-01-01 00:33:32
3
réponses
Comment utiliser OpenNLP avec Java?
Je veux afficher une phrase en anglais et faire un peu de traitement. Je voudrais utiliser openNLP. Je l'ai installé
Quand j'exécute la commande
I:WorkshopProgrammingnlpopennlp-tools-1.5.0-binopennlp-tools-1.5.0>java -jar opennlp-tools-1.5.0.ja …
demandé sur
1970-01-01 00:33:31
3
réponses
Keras prétraitement du texte — sauvegarde de L’objet Tokenizer à classer pour la notation
j'ai formé un modèle de classificateur de sentiment en utilisant la bibliothèque de Keras en suivant les étapes ci-dessous(en gros).
convertissez le corpus de texte en séquences en utilisant Tokenizer object / class
construisez un modèle en utilis …
demandé sur
1970-01-01 00:33:37
5
réponses
Nommé reconnaissance D’entité pour NLTK en Python. Identification de La NE
je dois classer les mots dans leurs parties de la parole. Comme un verbe, un nom, un adverbe, etc..
J'ai utilisé le
nltk.word_tokenize() #to identify word in a sentence
nltk.pos_tag() #to identify the parts of speech
nltk.ne_chunk() #to …
demandé sur
1970-01-01 00:33:31
8
réponses
Multi-terme des entités nommées dans Stanford de Reconnaissance des entités Nommées
j'utilise le Stanford Named Entity Recognizer http://nlp.stanford.edu/software/CRF-NER.shtml et ça marche très bien. C'est
List<List<CoreLabel>> out = classifier.classify(text);
for (List<CoreLabel> sentence : out) {
…
demandé sur
1970-01-01 00:33:32
5
réponses
Allocation de Dirichlet latente, pièges, conseils et programmes
j'expérimente avec Allocation De Dirichlet Latente pour le sujet désambiguïsation et affectation, et je suis à la recherche de conseils.
quel programme est le "meilleur", où le meilleur est une combinaison de plus facile à utiliser, meilleure esti …
demandé sur
1970-01-01 00:33:28
3
réponses
Lucene Analyseur Standard vs boule de neige
on commence avec Lucene.Net. J'ai indexé 100 000 lignes à l'aide d'un analyseur standard, j'ai lancé des requêtes de test, et j'ai remarqué que les requêtes plurielles ne renvoient pas de résultats si le terme original était singulier. Je comprends …
demandé sur
1970-01-01 00:33:30
2
réponses
Python Gensim: comment calculer la similarité des documents à l’aide du modèle LDA?
j'ai un modèle Lda formé et je veux calculer le score de similarité entre deux documents du corpus sur lequel j'ai formé mon modèle.
Après avoir étudié tous les tutoriels et fonctions de Gensim, Je n'arrive toujours pas à y voir clair. Quelqu'un peut …
demandé sur
1970-01-01 00:33:34
3
réponses
Combinaison D’un Tokenizer en une grammaire et D’un Parser avec NLTK
je me fraie un chemin à travers le livre NLTK et je ne peux pas sembler faire quelque chose qui semblerait être une première étape naturelle pour construire une grammaire décente.
Mon objectif est de construire une grammaire pour un corpus de textes …
demandé sur
1970-01-01 00:33:31
4
réponses
Comment utiliser Gensim doc2vec avec des vecteurs de mots pré-formés?
j'ai récemment découvert l'ajout de doc2vec à Gensim. Comment puis-je utiliser des vecteurs de mots préformés (par exemple trouvés dans le site Web original de word2vec) avec doc2vec?
ou doc2vec obtient-il les vecteurs de mots à partir des mêmes phr …
demandé sur
1970-01-01 00:33:34