Questions sur nltk

7
réponses

Comment vérifier si un mot est un mot anglais avec Python?

je veux vérifier dans un programme Python Si un mot est dans le dictionnaire anglais. je crois que NLTK wordn ... mot est dans le dictionnaire (par exemple, propriétés -> propriété -> mot anglais). Comment pourrais-je y parvenir?
demandé sur 2010-09-24 20:01:15
17
réponses

Stanford Parser et NLTK

Est-il possible d'utiliser Stanford Parser en NLTK? (Je ne parle pas de Stanford POS.)
demandé sur 2012-12-14 21:12:20
24
réponses

problème pip installer presque n'importe quelle bibliothèque

j'ai du mal à utiliser pip pour installer presque n'importe quoi. Je suis nouveau dans le codage, alors j'ai pensé que ... mentaires sur la façon dont je peux faire fonctionner pip ou quelque chose pour contourner le problème en attendant.
demandé sur 2013-05-04 08:29:21
12
réponses

n-grammes en python, quatre, cinq, six grammes?

je cherche un moyen de diviser un texte en n-grammes. Normalement je ferais quelque chose comme: import nltk fr ... s, mais y a-t-il un moyen de diviser mon texte en quatre grammes, cinq grammes ou même cent grammes? Merci!
demandé sur 2013-07-08 20:35:31
13
réponses

Ressources u'tokenizers/punkt/anglais.pickle " introuvable

Mon Code: import nltk.data tokenizer = nltk.data.load('nltk:tokenizers/punkt/english.pickle') message d ... r internet mais j'ai obtenu la même solution que ce que j'ai fait comme je l'ai mentionné dans mes étapes ci-dessus.
demandé sur 2014-10-26 10:52:51
6
réponses

Python: tf-idf-cosine: pour trouver la similarité des documents

je suivais un tutoriel qui était disponible sur Part 1 & Part 2 . Malheureusement, l'auteur n'a pas eu le temps p ... rt à deux vecteurs de longueur similaire mais ici Je ne suis pas sûr de savoir comment identifier les deux vecteurs.
demandé sur 2012-08-25 06:41:26
4
réponses

Comment extraire des phrases communes / significatives d'une série d'entrées textuelles

j'ai une série d'éléments de texte - HTML brut à partir d'une base de données MySQL. Je veux trouver les phrases les p ... a semble être un problème assez commun et je n'ai pas été en mesure de trouver une solution simple en cherchant ici.
demandé sur 2010-03-16 11:42:38
4
réponses

génération d'étiquettes à partir d'un contenu texte

je suis curieux de savoir s'il existe un algorithme/une méthode pour générer des mots-clés/Étiquettes à partir d'un te ... je vous serais reconnaissant si vous pointez une solution / bibliothèque basée sur Python pour cela. Merci
demandé sur 2010-04-18 13:39:23
3
réponses

Erreur SSL téléchargement de données NLTK

j'essaie de télécharger NLTK 3.0 pour une utilisation avec Python 3.6 sur Mac OS X 10.7.5, mais j'obtiens une erreur S ... NLTK télécharger SSL: certificat Vérifier a échoué download error using nltk.télécharger (en)
demandé sur 2016-12-27 19:22:49
4
réponses

Str.translate donne TypeError - Translate prend un argument( 2 donné), fonctionne en Python 2

j'ai le code suivant import nltk, os, json, csv, string, cPickle from scipy.stats import scoreatpercentile lmt ... is confus sur ce typographe parce que tout fonctionne parfaitement bien quand je le teste dans un fichier différent.
demandé sur 2014-04-20 01:32:28
17
réponses

Remplacement des nombres ordinaux

je cherche actuellement le moyen de remplacer des mots comme premier, deuxième, troisième,...avec une représentation o ... lors y en a-t-il ou devrais-je écrire quelques expressions régulières manuellement? Merci pour tout conseil
demandé sur 2012-03-10 18:27:49
2
réponses

BeatifulSoup4 obtenir le texte a encore javascript

j'essaie de supprimer tout le html/javascript en utilisant bs4, cependant, il ne se débarrasse pas de javascript. Je l ... ent vraiment lent parfois, et crée un retard perceptible, ce qui est une chose nltk a toujours été très bon avec.
demandé sur 2014-04-02 05:39:33
5
réponses

Comment créer un nuage de mots à partir d'un corpus en Python?

à Partir de la Création d'un sous-ensemble de mots à partir d'un corpus dans la R , le répondeur peut facilement ... brut ou NLTK corpus ou Gensim Mmcorpus dans un nuage de mots? le résultat ressemblera un peu à ceci:
demandé sur 2013-05-20 12:51:42
5
réponses

Qu'est-ce que NLTK tagger POS me demande de télécharger?

je viens de commencer à utiliser un tagger de la partie de la parole, et je suis confronté à de nombreux problèmes. ... tings\Administrator\Application Data\nltk_data' j'ai utilisé nltk.download() mais cela n'a pas fonctionné.
demandé sur 2011-12-21 17:14:02
6
réponses

Comment puis-je effectuer l'analyse de dépendance à NLTK?

en parcourant le livre NLTK, on ne voit pas très bien comment générer un arbre de dépendance à partir d'une phrase don ... hot-2, I-1) det(elephant-4, an-3) dobj(shot-2, elephant-4) prep(shot-2, in-5) poss(sleep-7, my-6) pobj(in-5, sleep-7)
demandé sur 2011-09-16 14:26:49
4
réponses

NLTK WordNet Lemmatizer: ne devrait-il pas lemmatize toutes les inflexions d'un mot?

J'utilise le NLTK WordNet Lemmatizer pour un projet de marquage D'une partie de la parole en modifiant d'abord chaque ... devrait avoir killing comme la tige si elle est utilisé comme un nom (comme dans the killing was done by xyz ).
demandé sur 2014-08-27 22:10:12
1
réponses

Tag pos de Python NLTK ne renvoie pas la tag correcte de la partie de la parole

ayant ceci: text = word_tokenize("The quick brown fox jumps over the lazy dog") et en cours d'exécution ... outil en ligne donne le même résultat; quick , brown et fox devraient être des adjectifs et non des noms.
demandé sur 2015-06-13 19:52:28
4
réponses

En utilisant NLTK et WordNet; comment convertir simple verbe tendu dans son présent, passé ou passé forme de participe?

en utilisant NLTK et WordNet , Comment puis-je convertir le verbe au temps simple dans sa forme actuelle, passée ... v = 'go' present = present_tense(v) print present # prints "going" past = past_tense(v) print past # prints "went"
demandé sur 2010-09-20 19:36:30
3
réponses

Mise en œuvre de sac-de-mots naïf - Classificateur Bayes en NLTK

j'ai essentiellement la même question que ce type .. L'exemple dans le livre nltk pour le classificateur Bayes ... ateurs NLTK construits. Est-ce le cas? Comment puis-je faire la classification fréquence/sac de mots NB avec NLTK?
demandé sur 2012-04-11 05:00:00
4
réponses

marquage personnalisé avec nltk

j'essaie de créer une petite langue anglaise pour spécifier les tâches. L'idée de base est de diviser un énoncé en ver ... 'utilisation du verbe plus fréquemment que le nom? Est-il un moyen pour former un tagueur? Est-il un meilleur moyen?
demandé sur 2011-05-07 09:36:46
4
réponses

Conversion des mots entre verbe / nom / formes adjectives

je voudrais une fonction de bibliothèque python qui traduit/convertit à travers différentes parties de la parole. parf ... ps a appelé la Conversion en linguistique http://en.wikipedia.org/wiki/Conversion_%28linguistics%29
demandé sur 2013-01-24 01:01:47
4
réponses

Extrait de la liste des personnes et des organisations utilisant Stanford Ner Tagger dans NLTK

j'essaie d'extraire la liste des personnes et des organisations utilisant Stanford Entity Recognizer (NER) en Python N ... d'une organisation, des personnes dans une phrase, Comment puis-je mettre les limites entre les différentes entités?
demandé sur 2015-06-05 13:49:58
8
réponses

Calcul de N grammes en utilisant Python

j'ai dû calculer les Unigrammes, bigrammes et trigrammes pour un fichier texte contenant du texte comme: " la ... omme dans le kystique et la fibrose ou la fibrose kystique. Quelqu'un peut m'aider comment je peux obtenir ce fait?
demandé sur 2012-11-17 00:26:35
2
réponses

erreur de téléchargement en utilisant nltk.télécharger()

j'expérimente le paquet NLTK en utilisant Python. J'ai essayé de télécharger NLTK en utilisant nltk.download() . J'a ... télécharger certains paquets, mais il obtient un message d'erreur lors du téléchargement oanc_masc
demandé sur 2014-12-26 17:35:06
1
réponses

TF * IDF pour les requêtes de recherche

Ok, donc j'ai suivi ces deux messages sur TF * IDF mais je suis un peu confus: http://css.dzone.com/articles/machin ... ray() transformer.fit(testVectorizerArray) tfidf = transformer.transform(testVectorizerArray) print tfidf.todense()
demandé sur 2012-08-11 06:44:49
2
réponses

Comment améliorer la vitesse avec Stanford NLP Tagger et NLTK

est-il possible d'utiliser le Standford Tagger de manière plus performante? chaque appel au wrapper de NLTK d ... and de langue étrangère est utilisé... http://www.nltk.org/api/nltk.tag.html#module-nltk.tag.stanford
demandé sur 2014-04-27 15:15:19
1
réponses

Ce qui a créé `maxent treebank pos tagger/english.cornichon`?

le nltk tagger de la partie de la parole intégré au paquet ne semble pas être optimisé pour mon cas d'utilisation ( ... e ça from nltk.data import load x = load("nltk_data/taggers/maxent_treebank_pos_tagger/english.pickle") dir(x)
demandé sur 2015-07-13 17:33:54
1
réponses

NLTK stanford pos tagger erreur: Échec de la commande Java

j'essaie d'utiliser nltk.tag.stanford module pour marquer une phrase (d'abord comme l'exemple de wiki) mais j' ... euses! quelque chose comme nltknltk.internals.config_java() ou ... ! Note: j'utilise linux (Xubuntu)!
demandé sur 2014-11-27 15:54:31
1
réponses

Stanford Named Entity Recognizer (NER) fonctionnalité avec NLTK

Est-ce possible: pour obtenir (similaire) de Stanford Entité Nommée de Reconnaissance de la fonctionnalité en utilisan ... parer pour utiliser NLTK pour extraire la pièce de localisation d'un texte s'il vous plaît? Merci d'avance!
demandé sur 2013-08-22 07:13:16
5
réponses

NLTK télécharger SSL: certificat de vérification échoué

j'obtiens l'erreur suivante en essayant d'installer Punkt pour nltk: nltk.download('punkt') [nltk_data] Er ... r [SSL: [nltk_data] CERTIFICATE_VERIFY_FAILED] certificate verify failed [nltk_data] (_ssl.c:590)> False
demandé sur 2016-08-12 14:04:22