我正在尝试制作网络解析器并将其保存。我找到了newspaper库。我正在使用Eclipse。但我无法取得好成绩。请帮帮我。
import newspaper
cnn_paper = newspaper.build('http://cnn.com')
for article in cnn_paper.articles:
print(article.url)
这是一条错误消息:
Traceback (most recent call last):
File "D:\workspace2\JesElaSearchSys\NespaperScraper_01.py", line 2, in <module>
import newspaper
File "C:\Python27\lib\site-packages\newspaper3k-0.1.5-py2.7.egg\newspaper\__init__.py", line 10, i
n <module>
from .article import Article, ArticleException
File "C:\Python27\lib\site-packages\newspaper3k-0.1.5-py2.7.egg\newspaper\article.py", line 12, in
<module>
from . import images
File "C:\Python27\lib\site-packages\newspaper3k-0.1.5-py2.7.egg\newspaper\images.py", line 15, in
<module>
import urllib.request
ImportError: No module named request
答案 0 :(得分:2)
您的代码没有任何问题。您需要安装或找到newspaper
和request
库。您的开发计算机上似乎缺少newspaper
/ request
库。
$ pip install newspaper
$ pip install urllib3
上面的命令将帮助您安装它。
答案 1 :(得分:1)
虽然已有答案,但Python2的报纸库已被弃用,应予以避免。
报纸已被弃用于Python2,根据他们的official documentation,它是一个有缺陷的版本。你应该切换到Python3版本。
在Python 3上安装:
pip3 install newspaper3k
报纸是一个Python3库!或者,查看我们已弃用且有缺陷的Python2分支。运行:pip3安装newspaper3k而不是pip3安装报纸。在python3上你必须安装newspaper3k,而不是报纸。报纸是我们的python2库。虽然使用pip安装报纸很简单,但如果你想在ubuntu上安装,你会遇到可修复的问题。