Bibliothèque de parseurs de flux RSS en Python

je suis à la recherche d'une bonne bibliothèque en python qui m'aidera à analyser les flux RSS. Quelqu'un a utilisé feedparser? Tous les commentaires?

36
demandé sur rahman.bd 2010-02-11 16:57:29

7 réponses

utiliser feedparser est une bien meilleure option que rouler votre propre avec minidom ou BeautifulSoup.

  • il normalise les différences entre toutes les versions de RSS et Atom de sorte que vous ne devez pas avoir de code différent pour chaque type.
  • il est bon de détecter différents formats de date et d'autres variations dans les flux.
  • il suit automatiquement les redirections HTTP.
  • il assainit le contenu HTML.
  • il a le soutien D'ETag et Les en-têtes Last-Modified de sorte que vous pouvez voir si le flux a changé juste en téléchargeant L'en-tête HTTP et pas le flux entier.
  • il supporte les flux authentifiés.
  • il supporte les mandataires HTTP.

comme d'autres l'ont mentionné, essayez. C'est comme 2 lignes de code pour analyser un flux. Ma seule plainte est qu'il utilise juste des dictionnaires comme modèle de données et certains attributs peuvent être absents du dictionnaire s'ils n'étaient pas dans le flux, donc vous vérifier que dans votre code. Mais la documentation est très claire sur les attributs qui seront toujours dans le dictionnaire et qui pourraient manquer.

enfin, je peux m'en porter garant, car j'ai écrit une application qui l'utilise. Voir ici: http://www.feednotifier.com/

50
répondu FogleBird 2010-02-11 15:23:09

Exemple

Déterminez le nombre de réponses à votre question:

easy_install feedparser
python -c 'import feedparser; print len(feedparser.parse("http://bit.ly/c785aj")["entries"])'
10
répondu flybywire 2010-02-11 15:29:10

je sais que c'est un sujet très ancien, mais pour ce qu'il vaut, j'ai utilisé feedparser (Universal feed parser) version 5.1.3 et j'ai récemment swiched à speedparser

je l'utilise pour un amateur Python-pour-Android application et speedparser fonctionne environ 5 fois plus vite sur mes flux.

2
répondu Andre Miras 2014-08-14 21:56:54

http://www.feedparser.org/

tout d'Abord frappé sur G.

1
répondu piotr 2010-02-11 13:59:22

En réponse à votre suivi. Vous pourriez utiliser BeautifulSoup-mais feedparser est beaucoup mieux adapté à la manipulation RSS.

Pas de snark - mais avez-vous lu feedparsers documentation