如何解析HTML然后将其写入.py文件

时间:2016-03-06 15:57:24

标签: python html file-writing

我正在尝试解析一些HTML,然后将该HTML写入.py文件。这是我正在使用的代码:

from html.parser import HTMLParser

class MyHTMLParser(HTMLParser):
    def handle_data(self, data):
        print(data)
        f = open('/Users/austinhitt/Desktop/Test.py', 'w')
        f = open('/Users/austinhitt/Desktop/Test.py', 'r')
        t = f.read()
        f = open('/Users/austinhitt/Desktop/Test.py', 'w')
        f.write(t + '\n' + data)
        f.close()

parser = MyHTMLParser()
parser.feed('<html>'
            '<body>'
            '<p>import time as t</p>'
            '<p>from os import path</p>'
            '<p>import os</p>'
            '</body>'
            '</html>')

我没有收到任何错误,但只有最后一个p标记的内容被放入文件中。我只想要将p标签内的内容添加到文件中,而不是p标签本身。我需要添加到文件中的每个p标签的内容,我不想使用BeautifulSoup或其他非内置模块。我使用的是Python 3.5.1

1 个答案:

答案 0 :(得分:0)

您似乎在阅读文件&#34; Test.py&#34;使用后&#34;写&#34;模式,可能会导致数据丢失。