Question

我正在尝试解析一些HTML，然后将该HTML写入.py文件。这是我正在使用的代码：

from html.parser import HTMLParser

class MyHTMLParser(HTMLParser):
    def handle_data(self, data):
        print(data)
        f = open('/Users/austinhitt/Desktop/Test.py', 'w')
        f = open('/Users/austinhitt/Desktop/Test.py', 'r')
        t = f.read()
        f = open('/Users/austinhitt/Desktop/Test.py', 'w')
        f.write(t + '\n' + data)
        f.close()

parser = MyHTMLParser()
parser.feed('<html>'
            '<body>'
            '<p>import time as t</p>'
            '<p>from os import path</p>'
            '<p>import os</p>'
            '</body>'
            '</html>')

我没有收到任何错误，但只有最后一个p标记的内容被放入文件中。我只想要将p标签内的内容添加到文件中，而不是p标签本身。我需要添加到文件中的每个p标签的内容，我不想使用BeautifulSoup或其他非内置模块。我使用的是Python 3.5.1

Answer 1

您似乎在阅读文件＆＃34; Test.py＆＃34;使用后＆＃34;写＆＃34;模式，可能会导致数据丢失。

如何解析HTML然后将其写入.py文件

1 个答案: