Question

我正在以下列方式使用Django URLValidator：

def clean_url(self):
    validate = URLValidator(verify_exists=True)
    url = self.cleaned_data.get('url')

    try:
        logger.info(url)
        validate(url)
    except ValidationError, e:
        logger.info(e)
        raise forms.ValidationError("That website does not exist. Please try again.")

    return self.cleaned_data.get('url')

它似乎适用于某些网址，但对于某些有效的网址，它会失败。我能够用http://www.amazon.com/检查它是否失败（这显然是不正确的）。它通过http://www.cisco.com/。是否存在伪造错误的原因？

Answer 1

看the source for URLValidator;如果您指定check_exists，则会向该网址发出HEAD请求以检查其是否有效：

req = urllib2.Request(url, None, headers)
req.get_method = lambda: 'HEAD'
...
opener.open(req, timeout=10)

尝试自己向亚马逊提出HEAD请求，您会看到问题：

carl@chaffinch:~$ HEAD http://www.amazon.com
405 MethodNotAllowed
Date: Mon, 13 Aug 2012 18:50:56 GMT
Server: Server
Vary: Accept-Encoding,User-Agent
Allow: POST, GET
...

除了使用猴子修补或以其他方式扩展URLValidator以使用GET或POST请求之外，我无法找到解决此问题的方法;在这样做之前，你应该仔细考虑是否要使用check_exists（没有这个问题就应该消失）。正如core/validators.py本身所说，

“URLField verify_exists参数存在棘手的安全性和性能问题。因此，它已被弃用。”

你会发现Django的开发版本确实完全处理了这个功能。

django URLValidator产生了虚假错误

1 个答案: