我编写了以下代码,用于搜索URL并将HTML保存到文本文件中。但是,我有两个问题
有什么想法吗?
import urllib.request
while True: # this is an infinite loop
with urllib.request.urlopen('WEBSITE_URL') as f:
fDecoded = f.read().decode('utf-8')
data = str(fDecoded .read()).replace('\n', '') # does not seem to work?
myfile = open("TestFile.txt", "r+")
myfile.write(data)
print ('----------------')
答案 0 :(得分:1)
当你这样做时 -
fDecoded = f.read().decode('utf-8')
fDecoded
已经是str
类型,您正在从请求中读取字节字符串,并使用str
编码将其解码为utf-8
。
然后在此之后你不能打电话 -
str(fDecoded .read()).replace('\n', '')
str
没有方法read()
,您实际上并不需要再次将其转换为str。只是做 -
data = fDecoded.replace('\n', '')