如何使用python从外部HTML(网站)获取代码片段

时间:2016-10-11 10:45:04

标签: python html

我想从一个带有python的HTML网站上获取一个片段。

例如,来自网址http://steven-universe.wikia.com/wiki/Steven_Universe_Wiki我希望获得框中的文字"下一集",作为字符串。我怎么能得到它?

1 个答案:

答案 0 :(得分:0)

首先从here下载BeautifulSoup最新版本 来自here

的请求
from bs4 import BeautifulSoup
import requests

con = requests.get(url).content
soup = BeautifulSoup(con)
text = soup.find_all("a",href="/wiki/Gem_Harvest").text;
print(link)