preguntar acerca de n-gram
3
réponses
Recherche de nom de fichier avec ElasticSearch
Je veux utiliser ElasticSearch pour rechercher des noms de fichiers (pas le contenu du fichier). Donc j'ai besoin de trouver une partie du nom de fichier (correspondance exacte, pas de recherche floue).
Exemple:
J'ai des fichiers avec les noms suiva …
demandé sur
1970-01-01 00:33:32
1
réponses
Comprendre l’argument » Ngram range` dans un CountVectorizer dans sklearn
je suis un peu confus sur la façon d'utiliser les ngrams dans la bibliothèque scikit-learn en Python, en particulier, comment le ngram_range l'argument fonctionne dans un CountVectorizer.
exécuter ce code:
from sklearn.feature_extraction.text im …
demandé sur
1970-01-01 00:33:34
2
réponses
N-grammes: explication + 2 applications
je veux implémenter quelques applications avec n-grammes (de préférence en PHP).
quel type de n-grammes est le plus adéquat pour la plupart des utilisations? Un niveau de mot ou un niveau de caractère n-gram? Comment Pouvez-vous implémenter un n-g …
demandé sur
1970-01-01 00:33:29
5
réponses
Simple implémentation de la similarité n-Gram, TF-idf et cosinus en Python
je dois comparer des documents stockés dans un DB et trouver un score de similarité entre 0 et 1.
la méthode que je dois utiliser doit être très simple. Mise en œuvre d'une version vanille de n-grammes (où il est possible de définir combien …
demandé sur
1970-01-01 00:33:30
12
réponses
n-grammes en python, quatre, cinq, six grammes?
je cherche un moyen de diviser un texte en n-grammes.
Normalement je ferais quelque chose comme:
import nltk
from nltk import bigrams
string = "I really like python, it's pretty awesome."
string_bigrams = bigrams(string)
print string_bigrams
…
demandé sur
1970-01-01 00:33:33
8
réponses
Calcul de N grammes en utilisant Python
j'ai dû calculer les Unigrammes, bigrammes et trigrammes pour un fichier texte contenant du texte comme:
" la fibrose kystique affecte 30 000 enfants et jeunes adultes aux États-Unis seulement
Inhaler les brouillards de l'eau salée peut rédui …
demandé sur
1970-01-01 00:33:32