所以这里是我已经写过的代码,如果这是正确的方法,我现在不会。
import os
import requests
import webbrowser
import bs4
print('Enter link:')
siteL = input()
webdoc = requests.get(siteL)
webdoc.raise_for_status()
webhtml = bs4.BeautifulSoup(webdoc.text, 'html.parser')
for chunk in webdoc.iter_content(10000):
webhtml.write(chunk)
webhtml.close()
感谢。
答案 0 :(得分:0)
您可以像这样使用urlretrieve:
urlretrieve("http://www.example.com/somePage.html#someDivWithString", "path/to/textFile.txt")
当然,您必须导入urllib
并将导入附加到上述请求中。
N.B。将path/to/textFile.txt
替换为文本文件的路径,将#someDivWithString
替换为包含字符串的div的ID。
答案 1 :(得分:0)
from bs4 import BeautifulSoup as bs
import requests as req
link_to_download=raw_input("Enter Link :")
outfile_name=raw_input("outfilename:")
f=open(outfile_name,"w")
response=req.get(link_to_download)
soup=response.content
soup=bs(soup,"html.parser")
f.write(str(soup.title.string))
f.write("\n")
s=soup.prettify().encode("utf-8")
f.write(str(s))
f.close()