RegEx用于在textConent元素中提取特殊模式

时间:2019-05-21 03:29:47

标签: python html regex python-3.x regex-greedy

我正试图从此html代码中提取演出的标题,但有些演出的周围带有不同的单词,因此我不知道如何使用正则表达式提取所有演出。

qpac_url = 'https://qpac.com.au/event/'
qpac_page = urlopen(qpac_url)
qpac_html = qpac_page.read().decode('utf-8')
qpac_title = findall('''<div class="title">\s+<h3>\s+([.]*)''', qpac_html)

这是我要从中提取的html代码,突出显示的文本是标题

image

0 个答案:

没有答案