我正在尝试解析一些HTML,然后将该HTML写入.py文件。这是我正在使用的代码:
from html.parser import HTMLParser
class MyHTMLParser(HTMLParser):
def handle_data(self, data):
print(data)
f = open('/Users/austinhitt/Desktop/Test.py', 'w')
f = open('/Users/austinhitt/Desktop/Test.py', 'r')
t = f.read()
f = open('/Users/austinhitt/Desktop/Test.py', 'w')
f.write(t + '\n' + data)
f.close()
parser = MyHTMLParser()
parser.feed('<html>'
'<body>'
'<p>import time as t</p>'
'<p>from os import path</p>'
'<p>import os</p>'
'</body>'
'</html>')
我没有收到任何错误,但只有最后一个p标记的内容被放入文件中。我只想要将p标签内的内容添加到文件中,而不是p标签本身。我需要添加到文件中的每个p标签的内容,我不想使用BeautifulSoup或其他非内置模块。我使用的是Python 3.5.1
答案 0 :(得分:0)
您似乎在阅读文件&#34; Test.py&#34;使用后&#34;写&#34;模式,可能会导致数据丢失。