preguntar acerca de tesseract

12
réponses

traitement d’image pour améliorer tesseract OCR précision

J'ai utilisé tesseract pour convertir des documents en texte. La qualité des documents varie énormément, et je cherche des conseils sur le type de traitement d'image qui pourrait améliorer les résultats. J'ai remarqué que le texte hautement pixellisé …
demandé sur 1970-01-01 00:33:32
5
réponses

Pourquoi Tesseract OCR library (iOS) ne peut pas reconnaître le texte du tout?

J'essaie d'utiliser la bibliothèque Tesseract OCR dans mon application iOS. J'ai téléchargé la bibliothèque tesseract-ios de github et quand j'ai essayé de reconnaître une simple image de texte, j'ai eu des ordures à la place. Voici une image de ce q …
demandé sur 1970-01-01 00:33:33
1
réponses

Améliorer les résultats OCR de Tesseract avec un texte flou

je travaille sur la reconnaissance OCR du texte imprimé. En particulier, je me concentre sur l'étape de prétraitement pour améliorer les résultats de l' Tesseract moteur. J'ai déjà obtenu de bons résultats avec le battage adaptatif, l'élimination du …
demandé sur 1970-01-01 00:33:34
3
réponses

Comment trouver les paramètres pris en charge dans le fichier de configuration OCR de Tesseract

je veux savoir quels paramètres le fichier de configuration utilisé par Tesseract OCR accepte, comment écrire un fichier de configuration, etc. je ne trouve pas de documentation à ce sujet sur leur site. Comment puis-je déterminer quels paramètres s …
demandé sur 1970-01-01 00:33:32
8
réponses

Tesseract OCR exemple simple

Bonjour, vous pouvez me donner un exemple simple de testing Tesseract OCR de préférence en C#. J'ai essayé la démo trouvé ici. Je télécharge l'ensemble de données en anglais et décompresse le lecteur C. et modifié le code comme suit: string path = @ …
demandé sur 1970-01-01 00:33:33
4
réponses

Tesseract 3 (OCR) -.net Wrapper

http://code.google.com/p/tesseractdotnet/ j'ai du mal à faire travailler Tesseract dans Mes projets Visual Studio 2010. J'ai essayé la console et les winforms et les deux ont le même résultat. J'ai rencontré une dll par quelqu'un d'autre qui préten …
demandé sur 1970-01-01 00:33:32
2
réponses

Améliorer les performances OCR sur les scanners multi-paragraphes

je travaille sur un projet qui implique l'extraction de textes scientifiques stockés en format PDF. Pour la plupart des papiers, Ceci est accompli assez facilement en utilisant PDFMiner, mais certains vieux papiers stockent leur texte comme de grand …
demandé sur 1970-01-01 00:33:32
2
réponses

Quelles options de ROC existent au-delà de Tesseract? [fermé]

j'ai utilisé Tesseract un peu et ses résultats laissent beaucoup à désirer. Je détecte actuellement de très petites images (35x15, sans bordure, mais j'ai essayé d'en ajouter une avec imagemagick sans avantage ocr); elles vont de 2 caractères à 5 et …
demandé sur 1970-01-01 00:33:32
5
réponses

Comment puis-je segmenter un document en utilisant Tesseract puis sortir les boîtes de délimitation et les étiquettes résultantes

J'essaie de faire en sorte que Tesseract produise un fichier avec des boîtes délimitées qui résultent de la segmentation de la page (pré OCR). Je sais qu'il doit être capable de faire cela "hors des sentiers battus" en raison des résultats présentés …
demandé sur 1970-01-01 00:33:35
3
réponses

Format Tesseract et tiff-spp Non défini (1,3)}

en essayant d'exécuter cette commande: tesseract bond111.tif bond111 batch.nochop makebox j'obtiens l'erreur suivante Error in pixReadFromTiffStream: spp not in set {1,3} Error in pixReadStreamTiff: pix not read Error in pixReadTiff: pix not read …
demandé sur 1970-01-01 00:33:31