我正在尝试使用正则表达式匹配Python中的html代码。我正在使用的行是html的“第50页第1页”。 我用Google搜索了re文档并尝试了以下代码:
pattern = 'Page [0-9]+ of ([0-9]+)'
#or
pattern = r'Page [0-9]+ of ([0-9]+)/w'
这无济于事。我该怎么办?
@property
def page_count(self):
content = self.soup.select_one(AllBooksPageLocators.PAGER).string
pattern = 'Page [0-9]+ of ([0-9]+)'
matcher = re.search(pattern, content)
pages = int(matcher.group(1))
return pages