如何使用Python报纸库?

时间:2015-06-04 13:51:41

标签: python python-newspaper

我正在尝试制作网络解析器并将其保存。我找到了newspaper库。我正在使用Eclipse。但我无法取得好成绩。请帮帮我。

import newspaper

cnn_paper = newspaper.build('http://cnn.com')

for article in cnn_paper.articles:
    print(article.url)

这是一条错误消息:

Traceback (most recent call last):
  File "D:\workspace2\JesElaSearchSys\NespaperScraper_01.py", line 2, in <module>
    import newspaper
  File "C:\Python27\lib\site-packages\newspaper3k-0.1.5-py2.7.egg\newspaper\__init__.py", line 10, i
n <module>
    from .article import Article, ArticleException
  File "C:\Python27\lib\site-packages\newspaper3k-0.1.5-py2.7.egg\newspaper\article.py", line 12, in
 <module>
    from . import images
  File "C:\Python27\lib\site-packages\newspaper3k-0.1.5-py2.7.egg\newspaper\images.py", line 15, in 
<module>
    import urllib.request
ImportError: No module named request

2 个答案:

答案 0 :(得分:2)

您的代码没有任何问题。您需要安装或找到newspaperrequest库。您的开发计算机上似乎缺少newspaper / request库。

$ pip install newspaper
$ pip install urllib3

上面的命令将帮助您安装它。

答案 1 :(得分:1)

虽然已有答案,但Python2的报纸库已被弃用,应予以避免。

报纸已被弃用于Python2,根据他们的official documentation,它是一个有缺陷的版本。你应该切换到Python3版本。

在Python 3上安装:

pip3 install newspaper3k

报纸是一个Python3库!或者,查看我们已弃用且有缺陷的Python2分支。运行:pip3安装newspaper3k而不是pip3安装报纸。在python3上你必须安装newspaper3k,而不是报纸。报纸是我们的python2库。虽然使用pip安装报纸很简单,但如果你想在ubuntu上安装,你会遇到可修复的问题。