Bs4创建的对象非常慢

时间:2017-09-01 08:57:29

标签: python web-scraping bs4

我有问题。只有PYTHON2。

r = self.session.get('http://..................')
print "CREATE BS"
print datetime.now()
soup = BeautifulSoup(r.content, 'html.parser')
print "CREATE BS END"
print datetime.now()

结果是:

CREATE BS
2017-09-01 11:45:22.822256
CREATE BS END
2017-09-01 11:46:56.992892

我不认为这是正常的:1.5分钟来解析HTML。 1周前我对这个源代码没有问题。谁知道bs4的问题?

使用python3,一切都是3秒钟。

1 个答案:

答案 0 :(得分:1)

伙计我不相信,但问题在于编码:D经过bs4源代码的大量调试后,我找到了解决方案。解决方案是:

@if($category->parent)
   <td>{{ $category->parent->name }} <strong>-></strong> {{ $category->name }}</td>
@else
   <td>{{ $category->name }}</td>    
@endif

这个from_encoding =“utf8”让所有魔法变得神奇。但这绝对是bs4中的错误。应该没有这个工作:)正如我所说的python3没有问题。