preguntar acerca de information-retrieval

1
réponses

Tri inversé et argsort en python

j'essaie d'écrire une fonction en Python (toujours un noob!) qui renvoie les indices et les scores des documents commandés par les produits internes de leurs scores tfidf. La procédure est la suivante: calculer le vecteur des produits intérieurs en …
demandé sur 1970-01-01 00:33:31
3
réponses

Comment calculer TF * IDF pour qu’un seul nouveau document soit classé?

j'utilise des vecteurs document-terme pour représenter une collection de documents. J'utilise TF*IDF pour calculer le poids du terme pour chaque vecteur de document. Je pourrais alors utiliser cette matrice pour former un modèle de classification de …
demandé sur 1970-01-01 00:33:34
1
réponses

L’algorithme de Lucene

j'ai lu le papier par Doug Cutting; " optimisation de L'espace pour le classement total". Puisqu'il a été écrit il y a longtemps, je me demande quels algorithmes lucene utilise (concernant la liste de messages transversal et le calcul de score, le …
demandé sur 1970-01-01 00:33:32
2
réponses

Pourquoi le log est-il utilisé pour calculer le poids de fréquence de terme et IDF, inverse la fréquence de document?

la formule pour IDF est log (N / df t ) au lieu de Juste N / DF T. Où N = nombre total de documents dans la collection, et df t = fréquence des documents du terme t on dit que la bûche est utilisée parce qu'elle "amortit" l'effet des FDI. Qu'est- …
demandé sur 1970-01-01 00:33:34
5
réponses

Cosine similarity et tf-idf

je suis déconcerté par le commentaire suivant au sujet de TF-IDF et Cosinus Similar. j'étais en train de lire sur les deux et puis sur wiki sous Cosine Similarity je trouve cette phrase "en cas de recherche d'information, la similarité cosine de …
demandé sur 1970-01-01 00:33:31
6
réponses

Python: tf-idf-cosine: pour trouver la similarité des documents

je suivais un tutoriel qui était disponible sur Part 1 & Part 2 . Malheureusement, l'auteur n'a pas eu le temps pour la dernière section, qui consistait à utiliser la similarité cosinus pour trouver la distance entre deux documents. J'ai su …
demandé sur 1970-01-01 00:33:32