preguntar acerca de lemmatization
2
réponses
word2vec lemmatisation du corpus avant la formation
Word2vec semble être principalement formé sur les données brutes de corpus. Toutefois, la lemmatisation est un prétraitement standard pour de nombreuses tâches de similarité sémantique. Je me demandais si quelqu'un avait de l'expérience dans la lemma …
demandé sur
1970-01-01 00:33:34
20
réponses
Comment puis-je procéder à un écaillage de mots ou à une lemmatisation?
J'ai essayé PorterStemmer et boule de neige, mais les deux ne fonctionnent pas sur tous les mots, manquant certains très communs.
mes mots d'essai sont:" cats running ran cactus cactus community communities ", et les deux obtiennent mo …
demandé sur
1970-01-01 00:33:29