如何将网址内容保存为.txt文件?

时间:2017-09-27 11:03:19

标签: python html url

代码失败。

有人可以帮忙吗?

我在堆栈溢出中搜索,并尝试了一些方法,但我似乎找不到任何方法。

from urllib.request import urlopen

link = "https://www.youtube.com/live_chat?v=IKQkjWmqQv8&is_popout=1"

f = urlopen(link)
myfile = f.read()
print (myfile)
output_file = open('1.txt','w')
output_file.write(myfile)
output_file.close()

3 个答案:

答案 0 :(得分:2)

试试这段代码:

from urllib.request import urlopen

link = "https://www.youtube.com/live_chat?v=IKQkjWmqQv8&is_popout=1"

f = urlopen(link)
myfile = f.read()
print (myfile)
output_file = open('1.txt','wb')
output_file.write(myfile)
output_file.close()

答案 1 :(得分:1)

您从read()获得了一个字节,您可以通过添加b以二进制模式将其写入您的文件,如下所示:

from urllib.request import urlopen

link = "https://www.youtube.com/live_chat?v=IKQkjWmqQv8&is_popout=1"

f = urlopen(link)
myfile = f.read()
print (myfile)

with open('output.html','wb') as output_file:
    output_file.write(myfile)

注意:使用with是处理文件的首选方法。之后它会自动关闭你的文件。

答案 2 :(得分:0)

其他答案都是正确的,但您可以将字节解码为字符串。要做到这一点,只需修改这两行:

...
output_file = open('1.txt', 'w', encoding="utf8")
output_file.write(myfile.decode("utf8"))
...