使用python从wix获取数据(文本)

时间:2018-02-09 18:28:10

标签: python html urllib wixcode

我正在创建一个python项目,我在其中创建了一个测试wix网站。 我想使用urllib从wix网站获取数据(文本) 所以我做了 url.urlopen(ADDRESS).readlines() 问题是它没有从页面中的文本中提供任何内容,只提供有关HTML页面结构的信息。 我如何从网站上摘取所要求的文字信息?

1 个答案:

答案 0 :(得分:1)

我认为您需要最终解析html以获取所需信息。看看这个python库:

https://docs.python.org/3/library/html.parser.html

您可能会做这样的事情:

from html.parser import HTMLParser
rel_data = []

class MyHTMLParser(HTMLParser):

    def handle_data(self, data):
         rel_data.append(data)


parser = MyHTMLParser()
parser.feed('<html><head><title>Test</title></head>'
            '<body><h1>Parse me!</h1></body></html>')
print(rel_data)

输出

["Test", "Parse me!"]