我正试图从此html代码中提取演出的标题,但有些演出的周围带有不同的单词,因此我不知道如何使用正则表达式提取所有演出。
qpac_url = 'https://qpac.com.au/event/'
qpac_page = urlopen(qpac_url)
qpac_html = qpac_page.read().decode('utf-8')
qpac_title = findall('''<div class="title">\s+<h3>\s+([.]*)''', qpac_html)
这是我要从中提取的html代码,突出显示的文本是标题