Questions sur nltk

7
réponses

Comment vérifier si un mot est un mot anglais avec Python?

je veux vérifier dans un programme Python Si un mot est dans le dictionnaire anglais. je crois que NLTK wordn ... mot est dans le dictionnaire (par exemple, propriétés -> propriété -> mot anglais). Comment pourrais-je y parvenir?
demandé sur 2010-09-24 20:01:15
17
réponses

Stanford Parser et NLTK

Est-il possible d'utiliser Stanford Parser en NLTK? (Je ne parle pas de Stanford POS.)
demandé sur 2012-12-14 21:12:20
24
réponses

problème pip installer presque n'importe quelle bibliothèque

j'ai du mal à utiliser pip pour installer presque n'importe quoi. Je suis nouveau dans le codage, alors j'ai pensé que ... mentaires sur la façon dont je peux faire fonctionner pip ou quelque chose pour contourner le problème en attendant.
demandé sur 2013-05-04 08:29:21
12
réponses

n-grammes en python, quatre, cinq, six grammes?

je cherche un moyen de diviser un texte en n-grammes. Normalement je ferais quelque chose comme: import nltk fr ... s, mais y a-t-il un moyen de diviser mon texte en quatre grammes, cinq grammes ou même cent grammes? Merci!
demandé sur 2013-07-08 20:35:31
13
réponses

Ressources u'tokenizers/punkt/anglais.pickle " introuvable

Mon Code: import nltk.data tokenizer = nltk.data.load('nltk:tokenizers/punkt/english.pickle') message d ... r internet mais j'ai obtenu la même solution que ce que j'ai fait comme je l'ai mentionné dans mes étapes ci-dessus.
demandé sur 2014-10-26 10:52:51
6
réponses

Python: tf-idf-cosine: pour trouver la similarité des documents

je suivais un tutoriel qui était disponible sur Part 1 & Part 2 . Malheureusement, l'auteur n'a pas eu le temps p ... rt à deux vecteurs de longueur similaire mais ici Je ne suis pas sûr de savoir comment identifier les deux vecteurs.
demandé sur 2012-08-25 06:41:26
4
réponses

Comment extraire des phrases communes / significatives d'une série d'entrées textuelles

j'ai une série d'éléments de texte - HTML brut à partir d'une base de données MySQL. Je veux trouver les phrases les p ... a semble être un problème assez commun et je n'ai pas été en mesure de trouver une solution simple en cherchant ici.
demandé sur 2010-03-16 11:42:38
4
réponses

génération d'étiquettes à partir d'un contenu texte

je suis curieux de savoir s'il existe un algorithme/une méthode pour générer des mots-clés/Étiquettes à partir d'un te ... je vous serais reconnaissant si vous pointez une solution / bibliothèque basée sur Python pour cela. Merci
demandé sur 2010-04-18 13:39:23
3
réponses

Erreur SSL téléchargement de données NLTK

j'essaie de télécharger NLTK 3.0 pour une utilisation avec Python 3.6 sur Mac OS X 10.7.5, mais j'obtiens une erreur S ... NLTK télécharger SSL: certificat Vérifier a échoué download error using nltk.télécharger (en)
demandé sur 2016-12-27 19:22:49
6
réponses

lemmatisation de wordnet et tagging pos en python

je voulais utiliser wordnet lemmatizer en python et j'ai appris que la balise pos par défaut est NOUN et qu'elle ne produ ... aussi m'entraîner nltk.pos_tag() avec un corpus étiqueté ou puis-je l'utiliser directement sur mes données pour évaluer?
demandé sur 2013-03-23 16:23:54
4
réponses

NLTK and Stopwords Fail #lookuperror

j'essaie de lancer un projet d'analyse du sentiment et j'utiliserai la méthode des mots stop. J'ai fait quelques recherch ... sé à utiliser le paquet Goslate avec des ensembles de données en anglais Merci d'avoir lu! P. D.: j'utilise Ananconda
demandé sur 2014-11-02 01:05:16
4
réponses

Str.translate donne TypeError - Translate prend un argument( 2 donné), fonctionne en Python 2

j'ai le code suivant import nltk, os, json, csv, string, cPickle from scipy.stats import scoreatpercentile lmt ... is confus sur ce typographe parce que tout fonctionne parfaitement bien quand je le teste dans un fichier différent.
demandé sur 2014-04-20 01:32:28
4
réponses

NLTK la Reconnaissance des entités Nommées avec des Données Personnalisées

j'essaie d'extraire des entités nommées de mon texte en utilisant NLTK. Je trouve que NLTK NER n'est pas très précis pour ... ces-en dehors du NLTK cookbook et du nlp avec python que je peux utiliser? j'apprécierais vraiment aider dans ce domaine
demandé sur 2012-07-04 22:24:08
2
réponses

Comment tokenize une phrase de chaîne de caractères dans NLTK?

je suis en utilisant nltk, donc je veux créer mes propres textes comme ceux par défaut sur nltk.livre. Cependant, je viens ... ou de nltk me permet de faire cela. Et plus important encore, Comment puis-je sous-estimer les symboles de ponctuation?
demandé sur 2013-02-25 03:26:12
17
réponses

Remplacement des nombres ordinaux

je cherche actuellement le moyen de remplacer des mots comme premier, deuxième, troisième,...avec une représentation o ... lors y en a-t-il ou devrais-je écrire quelques expressions régulières manuellement? Merci pour tout conseil
demandé sur 2012-03-10 18:27:49
3
réponses

Apprentissage machine à grande échelle-Python ou Java? [fermé]

je me lance actuellement dans un projet qui impliquera de parcourir et de traiter d'énormes quantités de données (des cen ... ait-il facile de le mettre à l'échelle et de le gérer sur plusieurs machines, etc. lequel dois-je choisir et pourquoi?
demandé sur 2012-03-15 17:41:20
7
réponses

Amélioration de l'extraction des noms humains avec nltk

j'essaie d'extraire les noms humains du texte. quelqu'un aurait-il une méthode qu'ils recommanderaient? C'est ce que j ... r que Virgin Galactic n'est pas un nom humain dans le contexte de cet article est la partie dure (peut-être impossible).
demandé sur 2013-11-29 21:33:07
2
réponses

BeatifulSoup4 obtenir le texte a encore javascript

j'essaie de supprimer tout le html/javascript en utilisant bs4, cependant, il ne se débarrasse pas de javascript. Je l ... ent vraiment lent parfois, et crée un retard perceptible, ce qui est une chose nltk a toujours été très bon avec.
demandé sur 2014-04-02 05:39:33
1
réponses

Comment extraire des nombres (ainsi que des adjectifs de comparaison ou des gammes)

je travaille sur deux projets NLP-en Python, et les deux ont des tâches similaires pour extraire des valeurs et des opéra ... que chose comme: Entrée: "plus de 10$" Sortie: {'value': 10, 'unit': 'dollar', 'relation': 'gt', 'position': 3}
demandé sur 2017-07-16 10:19:27
3
réponses

Classification des Documents en catégories

j'ai environ 300k documents stockés dans une base de données Postgres qui sont marqués avec des catégories de sujet (il y ... uste au cas où le document ne rentre dans aucune des catégories? Voici mon cours de test http://gist.github.com/451880
demandé sur 2010-06-24 23:56:42
4
réponses

Comment modifier le tokenizer NLTK de phrases

j'utilise NLTK pour analyser quelques textes classiques et j'ai de la difficulté à tokeniser le texte par phrase. Par exe ... izer de phrase? Je préfère une simple heuristique que je peux pirater plutôt que d'avoir à former mon propre analyseur.
demandé sur 2012-12-31 03:59:00
12
réponses

Comment télécharger les données NLTK?

réponse mise à jour: NLTK fonctionne bien pour 2.7. J'ai eu 3.2. J'ai désinstallé 3.2 et installé 2.7. Maintenant ça fonc ... ages\nltk je ne vois Downloader là, je ne sais pas pourquoi il ne fonctionne pas. Python 3.2.2, système Windows vista.
demandé sur 2014-03-06 03:19:31
2
réponses

Comment créer mon propre texte NLTK à partir d'un fichier texte?

je suis étudiante en littérature, et j'ai parcouru le livre O'Reilly dans le traitement du langage naturel (nltk.org/book ... pas les miens. je suis très nouveau en Python et programmation, et donc ce truc est très excitant, mais très confus.
demandé sur 2012-05-06 04:13:23
5
réponses

Comment créer un nuage de mots à partir d'un corpus en Python?

à Partir de la Création d'un sous-ensemble de mots à partir d'un corpus dans la R , le répondeur peut facilement ... brut ou NLTK corpus ou Gensim Mmcorpus dans un nuage de mots? le résultat ressemblera un peu à ceci:
demandé sur 2013-05-20 12:51:42
3
réponses

Sujet modélisation dans MALLET vs NLTK

je viens de lire un article fascinant sur la façon dont MALLET pourrait être utilisé pour la modélisation de sujets, mais ... a plus d'outils et d'algorithmes sous le capot)? Où sont les bons articles qui répondent à ces deux premières questions?
demandé sur 2011-09-19 23:24:04
3
réponses

NLTK et Détection de la langue

Comment puis-je détecter la langue dans laquelle un texte est écrit en utilisant NLTK? Les exemples que j'ai vu utiliser nltk.detect, mais quand je l'ai installé sur mon mac, Je ne trouve pas ce paquet.
demandé sur 2010-07-06 01:30:32
5
réponses

Qu'est-ce que NLTK tagger POS me demande de télécharger?

je viens de commencer à utiliser un tagger de la partie de la parole, et je suis confronté à de nombreux problèmes. ... tings\Administrator\Application Data\nltk_data' j'ai utilisé nltk.download() mais cela n'a pas fonctionné.
demandé sur 2011-12-21 17:14:02
3
réponses

Vérificateur d'orthographe pour Python

Je suis assez nouveau avec Python et NLTK. Je suis occupé avec une application qui peut effectuer des vérifications ortho ... -ils? Comment Google fait-il par exemple parce que leur évocation orthographique est très bonne? Toutes les suggestions
demandé sur 2012-12-18 11:18:30
5
réponses

Comment utiliser la validation a k-fold cross dans scikit avec naïve bayes classifier et NLTK

j'ai un petit corpus et je veux calculer la précision de Bayes classifier naïf en utilisant 10 fois la validation croisée, comment faire.
demandé sur 2013-05-05 01:50:36
7
réponses

Impossible d'installer nltk sur Mac OS El Capitan

j'ai fait sudo pip install -U nltk tel que suggéré par la documentation nltk. Cependant, j'obtiens le résultat suivant: C ... confrontées à des problèmes pour d'autres installations de python sur El Capitan et je me demande si cela est dû à cela.
demandé sur 2015-10-02 02:57:39