网页抓取:无法提取所需的文本

时间:2020-01-21 17:39:58

标签: python web-scraping beautifulsoup

我正在尝试从该网址https://www.wuxiaworld.co/Horizon-Bright-Moon-Sabre/中提取新颖的描述

但是,当我尝试此代码时:

html=requests.get(site)
html.encoding = html.apparent_encoding
soup = BeautifulSoup(html.text,"html.parser")
summary = soup.find(id ='intro').get_text()
print (summary)

我得到:

说明

以退出代码0结束的过程

任何帮助,请先感谢。

1 个答案:

答案 0 :(得分:0)

尝试一下:

site = "https://www.wuxiaworld.co/Horizon-Bright-Moon-Sabre/"
html = requests.get(site)
soup = BeautifulSoup(html.content)
summary = soup.find(id ='intro')
print(summary.text)

打印输出:

傅红雪是个was子,腿脚and腿,天生 癫痫发作。他也是最有力量,最传奇的人物之一 武术界的人物,带有沉闷的黑色军刀 首屈一指。他的名气使他经常成为挑战者的目标, 但是每当他的军刀离开它的鞘时,只有尸体会留在里面 它的唤醒。但是有一天,F ...