抓取imdb前250个数据并使用python在powerpoint中复制

时间:2019-02-22 09:39:01

标签: python web-scraping lxml

Windows(32位)上的Python27

专家们,

我指的是这个网站

我试图做同样的事情,但是遇到这个错误并卡住了。

import win32com.client
import os
import win32com.gen_py.MSO as MSO # contains constants refering to Microsoft Office Objects
import win32com.gen_py.MSPPT as MSPPT # contains constants refering to Microsoft Office Power Point Objects
from lxml.html import parse

tree = parse('http://www.imdb.com/chart/top')
movies = tree.findall('.//table[@class="chart full-width"]//td[@class="titleColumn"]//a')
movies[0].text_content()
  • IOError: Error reading file 'http://www.imdb.com/chart/top': failed to load external entity "http://www.imdb.com/chart/top"

有人可以在这里帮助吗?

1 个答案:

答案 0 :(得分:0)

http://www.imdb.com/chart/top重定向到https://www.imdb.com/chart/top,lxml不支持安全连接。

选中此answer