preguntar acerca de lemmatization

2
réponses

word2vec lemmatisation du corpus avant la formation

Word2vec semble être principalement formé sur les données brutes de corpus. Toutefois, la lemmatisation est un prétraitement standard pour de nombreuses tâches de similarité sémantique. Je me demandais si quelqu'un avait de l'expérience dans la lemma …
demandé sur 1970-01-01 00:33:34
20
réponses

Comment puis-je procéder à un écaillage de mots ou à une lemmatisation?

J'ai essayé PorterStemmer et boule de neige, mais les deux ne fonctionnent pas sur tous les mots, manquant certains très communs. mes mots d'essai sont:" cats running ran cactus cactus community communities ", et les deux obtiennent mo …
demandé sur 1970-01-01 00:33:29