HTML Parse错误预期名称标记位于&#39; <! - [&<C \ nM3K4 @ C“] ITRL。

时间:2015-05-15 23:56:04

标签: python-2.7

我是Python新手。我使用Python 2.7.8来解析SEC文件。我的代码中的问题是:

&#13;
&#13;
    response = urllib2.urlopen('https://www.sec.gov/Archives/edgar/data/1053507/0001193125-11-042904.txt')
    HTML = stack.strip_tags(response.read())
&#13;
&#13;
&#13;

注意:strip_tags是基于following link之后的HTMLParser定义的。

但是我收到了这个错误&#34;引发了HTMLParseError(message,self.getpos()) HTMLParseError:预期名称标记位于&#39;

我使用相同的代码打开其他美国证券交易委员会的备案,但它运作正常。我用Google搜索,this link似乎是相关的。但即使我试图取代&#39;!&#39;用&#34;&#34;在调用strip_tags()和HTMLParseError之前,它仍然无法解决。任何想法和建议将非常感谢。

0 个答案:

没有答案