OCR par lots pour de nombreux fichiers PDF (pas déjà OCRed)? [fermé]
J'utilise Google Desktop Search (je suis sur Vista) et pas tous mes PDF les fichiers sont reconnus dans mon dossier d'archives. C'est normal car " Les fichiers PDF contenant des images numérisées " ne sont pas indexés ( http://desktop.google.com/support/bin/answer.py?hl=en&answer=90651 )
Je voudrais donc OCR beaucoup de mes fichiers PDF qui ne sont pas déjà OCRed. Mon objectif: Je donne un dossier au programme et il recherche seul dans les sous-dossiers les fichiers PDF qui doivent être convertis en fichiers PDF-OCRED.
Remarque : Dans le passé, si un fichier PDF était protégé par mot de passe, j'ai supprimé le mot de passe avec un autre outil de lot (payant): verypdf.com "pwdremover" http://www.verypdf.com/pwdremover/
Une idée (pas trop chère)?
J'ai déjà essayé : Finereader 6 pro sur xp à l'époque, mais il n'y avait pas de processeur par lots inclus... Paperfile paperfile.net qui utilise Tesseract http://code.google.com/p/tesseract-ocr / . Mais l'OCR n'est que PDF en texte, pas PDF en PDF! Il y en a aussi un autre projet http://code.google.com/p/ocropus/
Merci d'avance ;)