我是Python新手。我使用Python 2.7.8来解析SEC文件。我的代码中的问题是:
response = urllib2.urlopen('https://www.sec.gov/Archives/edgar/data/1053507/0001193125-11-042904.txt')
HTML = stack.strip_tags(response.read())

注意:strip_tags是基于following link之后的HTMLParser定义的。
但是我收到了这个错误"引发了HTMLParseError(message,self.getpos()) HTMLParseError:预期名称标记位于'
我使用相同的代码打开其他美国证券交易委员会的备案,但它运作正常。我用Google搜索,this link似乎是相关的。但即使我试图取代'!'用""在调用strip_tags()和HTMLParseError之前,它仍然无法解决。任何想法和建议将非常感谢。