preguntar acerca de text-extraction

9
réponses

Comment extraire une sous-chaîne en utilisant regex

J'ai une chaîne qui contient deux guillemets simples, le caractère '. Entre les guillemets simples sont les données que je veux. Comment puis-je écrire une expression rationnelle pour extraire" les données que je veux " du texte suivant? mydata = " …
demandé sur 1970-01-01 00:33:31
9
réponses

Comment extraire du texte des documents MS office en C#

j'essayais d'extraire un texte(chaîne) de MS Word (.doc. ,docx), Excel et Powerpoint en utilisant C#. Où puis-je trouver une bibliothèque. Net gratuite et simple pour lire les documents MS Office? J'ai essayé d'utiliser le NPOI mais je n'ai pas eu d' …
demandé sur 1970-01-01 00:33:29
15
réponses

Comment extraire du texte d’un PDF? [fermé]

est-ce que quelqu'un peut recommander une bibliothèque/API pour extraire le texte et les images d'un PDF? Nous devons être en mesure d'obtenir le texte qui est contenu dans les régions pré-connues du document, de sorte que L'API devra nous donner des …
demandé sur 1970-01-01 00:33:30
13
réponses

Module Python pour la conversion de PDF en texte [fermé]

Quels sont les meilleurs modules Python pour convertir des fichiers PDF en texte? ... …
demandé sur 1970-01-01 00:33:28