Comment trouver le flux RSS d'un site web particulier?
Comment trouver le flux RSS d'un site web particulier? S'il y a un moyen particulier de le trouver?
5 réponses
, Vous pourriez être en mesure de le trouver en regardant le source de la page d'accueil (ou blog). Recherchez une ligne qui ressemble à ceci:
<link rel="alternate" type="application/rss+xml" title="RSS Feed" href="http://example.org/rss" />
La valeur href sera l'endroit où se trouve le RSS.
Il existe plusieurs façons d'obtenir le flux RSS du site.
Ce que vous pouvez faire est d'obtenir la source de la page d'un site web et de rechercher cette balise de lien de type="application/rss+xml"
Qui contiendra le flux RSS de ce site web, le cas échéant.
Voici un programme simple en python qui imprimera le flux RSS de n'importe quel site web, le cas échéant.
import requests
from bs4 import BeautifulSoup
def get_rss_feed(website_url):
if website_url is None:
print("URL should not be null")
else:
source_code = requests.get(website_url)
plain_text = source_code.text
soup = BeautifulSoup(plain_text)
for link in soup.find_all("link", {"type" : "application/rss+xml"}):
href = link.get('href')
print("RSS feed for " + website_url + "is -->" + str(href))
get_rss_feed("http://www.extremetech.com/")
Enregistrez ce fichier avec l'extension. py et exécutez-le. Il vous donnera l'url de flux rss de ce site.
Google fournit également des API pour trouver les flux RSS d'un site web. Veuillez les trouver ici: Google Feed API
Vous devez parcourir toutes les URL de votre site Web, puis en trouver une contenant "rss".
La méthodeCi-dessus ne fonctionnera peut-être pas dans certains cas si l'url dans la balise href ressemble à feed.xml, donc dans ce cas vous aurez besoin d'une boucle sur toutes les balises contenant href ET rss, alors il suffit d'analyser l'url à partir de href attribut.
Si vous voulez le faire via le navigateur, appuyez sur CTRL + U pour afficher la source, puis CTRL + F pour ouvrir la fenêtre de recherche et puis tapez simplement rss . L'url du flux RSS devrait apparaître immédiatement.
Le menu Outils de Firefox a maintenant une commande "Page Info". L'un des onglets de cet outil affiche les informations de flux découvertes.
J'avais besoin de trouver des sites avec des flux RSS. En utilisant Visual Studio (VB), j'ai pu le faire. Le code suivant est juste un fragment. Il meurt après la fin de la boucle, mais il trouve n'importe quelle référence à une page rss sur le site. C'est tout ce dont j'avais besoin, donc je ne l'ai jamais fini. Mais il a travaillé pour moi.
Importations System.Net Importations System.IO
... Demande Dim comme WebRequest demande = WebRequest.Créer (" http://www.[site]")
Dim response As WebResponse = request.GetResponse()
Dim responseStream As Stream = response.GetResponseStream()
Dim reader As New StreamReader(responseStream)
Dim line As String = reader.ReadLine()
Dim intPos As Integer
Do
line = reader.ReadLine()
intPos = line.IndexOf("/rss")
If intPos > 0 Then
MessageBox.Show(line + " " + intPos.ToString)
End If
Loop While Not line Is Nothing
....