preguntar acerca de tf-idf
            1
            
    réponses
        Utilisation de la transformation TfidfVectorizer de Sklearn
            J'essaie d'obtenir le vecteur TF-idf pour un seul document en utilisant L'objet TfidfVectorizer de Sklearn. Je crée un vocabulaire basé sur certains documents de formation et utilise fit_transform pour former le TfidfVectorizer. Ensuite, je veux trou …        
        
        
            demandé sur
            1970-01-01 00:33:33
        
    
            2
            
    réponses
        Pourquoi le log est-il utilisé pour calculer le poids de fréquence de terme et IDF, inverse la fréquence de document?
            la formule pour IDF est log (N / df t ) au lieu de Juste N / DF T. 
Où N = nombre total de documents dans la collection, et df t = fréquence des documents du terme t
 on dit que la bûche est utilisée parce qu'elle "amortit" l'effet des FDI. Qu'est- …        
        
        
            demandé sur
            1970-01-01 00:33:34
        
    
            5
            
    réponses
        Cosine similarity et tf-idf
            je suis déconcerté par le commentaire suivant au sujet de  TF-IDF et  Cosinus Similar. 
 j'étais en train de lire sur les deux et puis sur wiki sous Cosine Similarity je trouve cette phrase "en cas de recherche d'information, la similarité cosine de …        
        
        
            demandé sur
            1970-01-01 00:33:31
        
    
            5
            
    réponses
        Simple implémentation de la similarité n-Gram, TF-idf et cosinus en Python
            je dois comparer des documents stockés dans un DB et trouver un score de similarité entre 0 et 1.     
    la méthode que je dois utiliser doit être très simple. Mise en œuvre d'une version vanille de n-grammes (où il est possible de définir combien …        
        
        
            demandé sur
            1970-01-01 00:33:30
        
    
            1
            
    réponses
        TF * IDF pour les requêtes de recherche
            Ok, donc j'ai suivi ces deux messages sur TF * IDF mais je suis un peu confus:    http://css.dzone.com/articles/machine-learning-text-feature       
    fondamentalement, je veux créer une requête de recherche qui contient des recherches à travers p …        
        
        
            demandé sur
            1970-01-01 00:33:32
        
    
            2
            
    réponses
        tf-idf fonction de poids en utilisant des sklearn.extraction de caractéristiques.texte.TfidfVectorizer
            cette page:    http://scikit-learn.org/stable/modules/feature_extraction.html    mentions:    
    
     comme tf–idf est un très souvent utilisé pour les traits de texte, il y a aussi une autre classe appelée  TfidfVectorizer  qui combine toutes le …        
        
        
            demandé sur
            1970-01-01 00:33:34
        
    
            6
            
    réponses
        Python: tf-idf-cosine: pour trouver la similarité des documents
            je suivais un tutoriel qui était disponible sur  Part 1   &   Part 2  . Malheureusement, l'auteur n'a pas eu le temps pour la dernière section, qui consistait à utiliser la similarité cosinus pour trouver la distance entre deux documents. J'ai su …        
        
        
            demandé sur
            1970-01-01 00:33:32
        
    
            7
            
    réponses
        Comment calculer la similitude cosinus de deux vecteurs?
            Comment trouver la similitude de cosinus entre les vecteurs?     
    je dois trouver la similitude pour mesurer la parenté entre deux lignes de texte.    
    Par exemple, j'ai deux phrases comme:    
    
      système d'interface utilisateur    …        
        
        
            demandé sur
            1970-01-01 00:33:29