如何避免Python BeautifulSoup中的错误

时间:2013-09-10 11:43:02

标签: beautifulsoup

这是我的程序

from bs4 import BeautifulSoup
import urllib2
url="http://www.moneycontrol.com/commodity/gold-price.html#05oct2013"
content = urllib2.urlopen(url).read()
soup = BeautifulSoup(content)

提供以下错误

Traceback (most recent call last):
  File "<interactive input>", line 1, in <module>
  File "C:\Python27\lib\bs4\__init__.py", line 183, in __init__
    self._feed()
  File "C:\Python27\lib\bs4\__init__.py", line 197, in _feed
    self.builder.feed(self.markup)
  File "C:\Python27\lib\bs4\builder\_htmlparser.py", line 156, in feed
    raise e
HTMLParseError: malformed start tag, at line 102, column 168

虽然

url="http://www.moneycontrol.com/commodity/" 

没有给出任何错误

1 个答案:

答案 0 :(得分:0)

两个站点都使用您的代码解析(使用html.parser或lxml作为解析器)。您使用的是哪个版本的Python和BeautifulSoup?您可以尝试使用different parser解析。