Faire une requête HTTP HEAD avec urllib2 de Python 2

j'essaie de faire une requête HEAD D'une page en utilisant Python 2.

j'essaie

import misc_urllib2
.....
opender = urllib2.build_opener([misc_urllib2.MyHTTPRedirectHandler(), misc_urllib2.HeadRequest()])

avec misc_urllib2.py contenant

class HeadRequest(urllib2.Request):
    def get_method(self):
        return "HEAD"


class MyHTTPRedirectHandler(urllib2.HTTPRedirectHandler):
    def __init__ (self):
        self.redirects = []

    def http_error_301(self, req, fp, code, msg, headers):  
        result = urllib2.HTTPRedirectHandler.http_error_301(
                self, req, fp, code, msg, headers)
        result.redirect_code = code
        return result

    http_error_302 = http_error_303 = http_error_307 = http_error_301

Mais je suis

TypeError: __init__() takes at least 2 arguments (1 given)

Si je ne l'

opender = urllib2.build_opener(misc_urllib2.MyHTTPRedirectHandler())

puis il fonctionne très bien

23
demandé sur Anthony Geoghegan 2010-12-12 13:16:59

4 réponses

Cela fonctionne bien:

import urllib2
request = urllib2.Request('http://localhost:8080')
request.get_method = lambda : 'HEAD'

response = urllib2.urlopen(request)
print response.info()

Testé avec quick Et dirty HTTPd piraté en python:

Server: BaseHTTP/0.3 Python/2.6.6
Date: Sun, 12 Dec 2010 11:52:33 GMT
Content-type: text/html
X-REQUEST_METHOD: HEAD

j'ai ajouté un champ d'en-tête personnalisé X-REQUEST_METHOD pour montrer qu'il fonctionne:)

voici HTTPd log:

Sun Dec 12 12:52:28 2010 Server Starts - localhost:8080
localhost.localdomain - - [12/Dec/2010 12:52:33] "HEAD / HTTP/1.1" 200 -

Edit: il y a aussi httplib2

import httplib2
h = httplib2.Http()
resp = h.request("http://www.google.com", 'HEAD')
57
répondu Paweł Prażak 2016-06-27 13:56:15

Essayer httplib

>>> import httplib
>>> conn = httplib.HTTPConnection("www.google.com")
>>> conn.request("HEAD", "/index.html")
>>> res = conn.getresponse()
>>> print res.status, res.reason
200 OK
>>> print res.getheaders()
[('content-length', '0'), ('expires', '-1'), ('server', 'gws'), ('cache-control', 'private, max-age=0'), ('date', 'Sat, 20 Sep 2008 06:43:36 GMT'), ('content-type', 'text/html; charset=ISO-8859-1')]

voir Comment envoyer une requête HTTP HEAD en Python 2?

1
répondu rogeliorv 2017-05-23 10:31:28

le problème réside dans votre classe HeadRequest, qui hérite d'urllib2.Demande. Selon le doc, urllib2.Request.__init__ la signature est

 __init__(self, url, data=None, headers={}, origin_req_host=None, unverifiable=False) 

donc vous devez lui passer un argument url. Dans votre deuxième essai, vous juste ne pas utiliser HeadRequest, c'est pourquoi il fonctionne.

0
répondu matiasg 2010-12-12 15:37:42

vous ne devez pas ajouter HeadRequest à build_opener ou add_handler il devrait être appelé comme ceci

opener = urllib2.build_opener(MyHTTPRedirectHandler)
response = opener.open(HeadRequest(url))
print response.getheaders()
0
répondu uingtea 2017-06-14 19:35:45