Distance Levenshtein rapide en R?

y a-t-il un paquet qui contient la fonction de comptage de distance Levenshtein qui est implémentée comme un code C ou Fortran? J'ai beaucoup de cordes à comparer et stringMatchMiscPsycho est trop lent pour cela.

24
demandé sur smci 2010-07-06 00:50:08

3 réponses

levenshteinDist (le RecordLinkage paquet) appels code C compilé. Lui donner un essai.

17
répondu George Dontas 2016-10-03 19:29:37

Et stringdist dans le stringdist colis n'est-il trop, même plus rapide que levenshteinDist sous certaines conditions (1)

14
répondu Ben 2014-03-28 16:45:09

Vous pouvez essayer stringDistBiostrings ainsi

6
répondu Aaron Statham 2016-10-03 19:30:01