为什么python模块报纸3k只为腾讯,新浪和wallettreetcn返回0篇文章?

时间:2018-11-27 15:00:07

标签: python web-scraping web-crawler python-newspaper sinaweibo

news3k库非常出色。我上瘾了。

我可以问一下,为什么Source和build()只从大多数中国金融新闻页面返回0条文章?

我的代码有问题吗?

from newspaper import Article, Source

url='https://wallstreetcn.com/live/global'

result=newspaper.Source(url,language='zh')

result.build()

result.size()

0

1 个答案:

答案 0 :(得分:0)

我运行您的代码并收到了不同的结果,也许您遇到了缓存问题。尝试添加memoize_articles=False,请参见:

import newspaper

url='https://wallstreetcn.com/live/global'
result = newspaper.Source(url, language='zh', memoize_articles=False)

result.build()
result.size()
>>> 2

您可以找到文档here