如何通过Python抓取网站内容

时间:2016-10-07 03:50:17

标签: python python-3.x web web-crawler

我正在学习Python。我想在一个URL上获取内容。获取网站上一个标题的所有文本并将其保存到文件.txt。你能告诉我一些代码示例吗?

1 个答案:

答案 0 :(得分:0)

Get all text in one title on the website我认为你的意思是得到页面的标题?

首先,你需要BeautifulSoup

如果您有pip,请使用

pip install beautifulsoup4

现在进入代码:

from bs4 import BeautifulSoup
from requests import get
r = get(url).text
soup = BeautifulSoup(r, 'html.parser')
title = soup.title.string #I save the title to a variable rather then jus
with open('url.txt', 'w') as f:
    f.write(title)

现在,无论您保存哪个脚本,都会有一个名为url.txt的文件,其中包含该网址。