Localisation du texte dans l'image

Je travaille actuellement sur un projet et mon objectif est de localiser le texte dans une image. OCR'ing le texte n'est pas mon intention pour le moment. Je veux essentiellement obtenir les limites du texte dans une image. J'utilise le AForge.Net composant d'imagerie pour la manipulation. Toute aide dans un sens ou un autre?

Mise à jour 2/5/09: J'ai depuis suivi un autre itinéraire dans mon projet. Cependant, j'ai essayé d'obtenir du texte en utilisant MODI (Microsoft Office Document Imaging). Il vous permet D'OCR une image et tirez le texte avec une certaine facilité.

26
demandé sur Rais Alam 2008-08-05 07:04:43

4 réponses

C'est un domaine de recherche actif. Il y a littéralement des tas de documents académiques sur le sujet. Il va être difficile de vous donner de l'aide en particulier sans plus de détails. Vous cherchez des types spécifiques de texte? Les polices? En anglais seulement? Êtes-vous familier avec la littérature académique?

La "détection de texte" est un problème standard dans n'importe quel système OCR (Reconnaissance optique de caractères) et par conséquent il y a beaucoup de bits de code sur les interwebs qui le traitent.

Je pourrait commencer à lister des tas de liens de google, mais je vous suggère de faire une recherche pour "détection de texte" et commencer à lire :). Il y a amplement d'exemple de code disponible aussi bien.

12
répondu Louis Brandy 2008-08-05 03:24:27

Reconnaître le texte à l'intérieur d'une image est en effet un sujet brûlant pour les chercheurs dans ce domaine, mais n'a commencé à devenir hors de contrôle que lorsque de captcha est devenu la "norme" en termes de défense contre les robots collecteurs de spam. Pourquoi utiliser captcha comme protection? Eh bien parce qu'il est/était très difficile de localiser (et lire) le texte à l'intérieur d'une image!

La raison pour laquelle je mentionne captcha est parce que le plus d'avancement* est fait dans cette petite zone, et je pense que votre solution pourrait être mieux trouvée y. surtout parce que les captcha sont en effet sur la localisation du texte (ou quelque chose qui ressemble à du texte) dans une image encombrée et ensuite essayer de lire les lettres correctement.

Donc, si vous pouvez vous trouver un bon outil de rupture de captcha open source vous avez probablement tout ce dont vous avez besoin pour continuer votre quête...
Vous pourriez probablement même jeter le code le plus dificile qui gère la reconnaissance de caractères elle-même, car ces OCR sont utilisés pour lire du texte déformé, quelque chose que vous n'avez pas à le faire.

*: avancement en termes de visible, utilisable et pratique informations pour un "non-chercheur"

3
répondu sven 2008-08-05 06:00:46

Si vous êtes d'accord avec l'utilisation d'une API en ligne pour cela, L'API à http://www.wisetrend.com/wisetrend_ocr_cloud.shtml peut faire la détection de texte en plus de juste OCR.

0
répondu Eugene Osovetsky 2010-06-23 05:49:10

La largeur du trait de transformer peut le faire pour vous. C'est au moins ce que MS a développé pour leur OS de téléphone mobile. Une discussion sur la mise en œuvre est ici à https://stackoverflow.com/

0
répondu Mathias 2017-05-23 12:17:05