preguntar acerca de lxml

7
réponses

Analyse HTML en python-lxml ou BeautifulSoup? Lequel d’entre eux est le meilleur pour quels types de fins?

D'après ce que je peux faire, les deux principales bibliothèques D'analyse HTML en Python sont lxml et BeautifulSoup. J'ai choisi BeautifulSoup pour un projet sur lequel je travaille, mais je l'ai choisi sans raison particulière autre que de trouver …
demandé sur 1970-01-01 00:33:29
1
réponses

Le raclage HTML à l’aide de lxml et de requêtes donne une erreur unicode [dupliquer]

Cette question a déjà une réponse ici: l'analyse du fichier XML obtient UnicodeEncodeError (ElementTree) / ValueError (lxml) 2 réponses J'essaie d'utiliser …
demandé sur 1970-01-01 00:33:34
3
réponses

Utiliser Python et lxml pour supprimer seulement les tags qui ont certains attributs / valeurs

je suis familier avec le programme etree strip_tags et strip_elements méthodes, mais je suis à la recherche d'un moyen simple de retirer les étiquettes (et de laisser leur contenu) qui ne contiennent que des attributs/valeurs spécifiques. par exempl …
demandé sur 1970-01-01 00:33:34
2
réponses

Parsing une table avec rowspan et colspan

j'ai une table que je dois analyser, en particulier c'est un horaire scolaire avec 4 blocs de temps, et 5 blocs de jours pour chaque semaine. J'ai essayé de l'analyser, mais honnêtement ne sont pas allés très loin parce que je suis coincé avec la faç …
demandé sur 1970-01-01 00:33:32
2
réponses

Py2exe lxml malheurs

j'ai une application wxpython qui dépend de lxml et qui fonctionne bien lorsque je l'exécute avec l'interpréteur python. Cependant, lors de la création d'un exe avec py2exe, j'ai eu cette erreur ImportError: No module named _elementpath j'ai ensu …
demandé sur 1970-01-01 00:33:31
4
réponses

Setup.py: installer lxml avec Python2.6 sur CentOS

j'ai installé Python 2.6.6 sur CentOS 5.4, [siyuan.tong@SC-055 lxml-2.3beta1]$ python Python 2.6.6 (r266:84292, Jan 4 2011, 09:49:55) [GCC 4.1.2 20080704 (Red Hat 4.1.2-46)] on linux2 Type "help", "copyright", "credits" or "license" for more infor …
demandé sur 1970-01-01 00:33:31
5
réponses

Utiliser Python Iterparse pour les gros fichiers XML

j'ai besoin d'écrire un analyseur en Python qui peut traiter des fichiers extrêmement Gros ( > 2 Go ) sur un ordinateur sans beaucoup de mémoire (seulement 2 Go). Je voulais utiliser iterparse dans lxml pour le faire. mon fichier est du format: …
demandé sur 1970-01-01 00:33:31
3
réponses

Ecrire un fichier xml en utilisant la bibliothèque lxml en Python

j'utilise lxml pour créer un fichier XML à partir de zéro; avoir un code comme ceci: from lxml import etree root = etree.Element("root") root.set("interesting", "somewhat") child1 = etree.SubElement(root, "test") Comment écrire root Element obj …
demandé sur 1970-01-01 00:33:30
3
réponses

Supprimer toutes les Balises javascript et les balises style de html avec python et le module lxml

j'analyse un document html en utilisant le http://lxml.de / library. Jusqu'à présent, j'ai compris comment supprimer des balises d'un document html dans lxml, comment supprimer une balise mais conserver tout le contenu? , mais la méthode d …
demandé sur 1970-01-01 00:33:31
6
réponses

lxml runtime error: Reason: Incompatible library version: etree.il faut donc la version 12.0.0 ou une version plus récente, mais libxml2.2.dylib fournit la version 10.0.0

j'ai un problème. J'ai utilisé la version mac 10.9, anaconda 3.4.1, python 2.7.6. développement d'applications web avec python-amazon-product-api. j'ai surmonté un obstacle lors de l'installation de lxml, en me référant à erreur clang: ar …
demandé sur 1970-01-01 00:33:34