我想在我的desptop上创建一个txt文件,然后我想下载一个网站的html字符串并将其安全地保存在txt文件中

时间:2017-02-11 19:46:03

标签: python html download

所以这里是我已经写过的代码,如果这是正确的方法,我现在不会。

import os
import requests
import webbrowser
import bs4

print('Enter link:')
siteL = input()

webdoc = requests.get(siteL)
webdoc.raise_for_status()
webhtml = bs4.BeautifulSoup(webdoc.text, 'html.parser')

for chunk in webdoc.iter_content(10000):
    webhtml.write(chunk)

webhtml.close()

感谢。

2 个答案:

答案 0 :(得分:0)

您可以像这样使用urlretrieve

urlretrieve("http://www.example.com/somePage.html#someDivWithString", "path/to/textFile.txt")

当然,您必须导入urllib并将导入附加到上述请求中。

N.B。path/to/textFile.txt替换为文本文件的路径,将#someDivWithString替换为包含字符串的div的ID。

答案 1 :(得分:0)

from bs4 import BeautifulSoup as bs
import requests as req
link_to_download=raw_input("Enter Link :")
outfile_name=raw_input("outfilename:")

f=open(outfile_name,"w")

response=req.get(link_to_download)
soup=response.content
soup=bs(soup,"html.parser")
f.write(str(soup.title.string))
f.write("\n")
s=soup.prettify().encode("utf-8")
f.write(str(s))
f.close()