preguntar acerca de nlp

3
réponses

Algorithmes de reconnaissance de formes dans le noeud.js ou PHP?

je voudrais commencer à expérimenter avec des algorithmes qui reconnaissent les modèles dans les données. Je traite avec de nombreux types de séquences (les pixels de l'image, la saisie de texte, les mouvements de l'utilisateur), et qu'il serait amus …
demandé sur 1970-01-01 00:33:32
3
réponses

Comment utiliser OpenNLP avec Java?

Je veux afficher une phrase en anglais et faire un peu de traitement. Je voudrais utiliser openNLP. Je l'ai installé Quand j'exécute la commande I:WorkshopProgrammingnlpopennlp-tools-1.5.0-binopennlp-tools-1.5.0>java -jar opennlp-tools-1.5.0.ja …
demandé sur 1970-01-01 00:33:31
3
réponses

Keras prétraitement du texte — sauvegarde de L’objet Tokenizer à classer pour la notation

j'ai formé un modèle de classificateur de sentiment en utilisant la bibliothèque de Keras en suivant les étapes ci-dessous(en gros). convertissez le corpus de texte en séquences en utilisant Tokenizer object / class construisez un modèle en utilis …
demandé sur 1970-01-01 00:33:37
5
réponses

Nommé reconnaissance D’entité pour NLTK en Python. Identification de La NE

je dois classer les mots dans leurs parties de la parole. Comme un verbe, un nom, un adverbe, etc.. J'ai utilisé le nltk.word_tokenize() #to identify word in a sentence nltk.pos_tag() #to identify the parts of speech nltk.ne_chunk() #to …
demandé sur 1970-01-01 00:33:31
8
réponses

Multi-terme des entités nommées dans Stanford de Reconnaissance des entités Nommées

j'utilise le Stanford Named Entity Recognizer http://nlp.stanford.edu/software/CRF-NER.shtml et ça marche très bien. C'est List<List<CoreLabel>> out = classifier.classify(text); for (List<CoreLabel> sentence : out) { …
demandé sur 1970-01-01 00:33:32
5
réponses

Allocation de Dirichlet latente, pièges, conseils et programmes

j'expérimente avec Allocation De Dirichlet Latente pour le sujet désambiguïsation et affectation, et je suis à la recherche de conseils. quel programme est le "meilleur", où le meilleur est une combinaison de plus facile à utiliser, meilleure esti …
demandé sur 1970-01-01 00:33:28
3
réponses

Lucene Analyseur Standard vs boule de neige

on commence avec Lucene.Net. J'ai indexé 100 000 lignes à l'aide d'un analyseur standard, j'ai lancé des requêtes de test, et j'ai remarqué que les requêtes plurielles ne renvoient pas de résultats si le terme original était singulier. Je comprends …
demandé sur 1970-01-01 00:33:30
2
réponses

Python Gensim: comment calculer la similarité des documents à l’aide du modèle LDA?

j'ai un modèle Lda formé et je veux calculer le score de similarité entre deux documents du corpus sur lequel j'ai formé mon modèle. Après avoir étudié tous les tutoriels et fonctions de Gensim, Je n'arrive toujours pas à y voir clair. Quelqu'un peut …
demandé sur 1970-01-01 00:33:34
3
réponses

Combinaison D’un Tokenizer en une grammaire et D’un Parser avec NLTK

je me fraie un chemin à travers le livre NLTK et je ne peux pas sembler faire quelque chose qui semblerait être une première étape naturelle pour construire une grammaire décente. Mon objectif est de construire une grammaire pour un corpus de textes …
demandé sur 1970-01-01 00:33:31
4
réponses

Comment utiliser Gensim doc2vec avec des vecteurs de mots pré-formés?

j'ai récemment découvert l'ajout de doc2vec à Gensim. Comment puis-je utiliser des vecteurs de mots préformés (par exemple trouvés dans le site Web original de word2vec) avec doc2vec? ou doc2vec obtient-il les vecteurs de mots à partir des mêmes phr …
demandé sur 1970-01-01 00:33:34