我想从下面的锚标记中提取'26'。我该怎么办?
<li>
<a href="https://ngodarpan.gov.in/index.php/home/statewise_ngo/2569/7/26?per_page=100" data-ci-pagination-page="26">Last</a>
</li>
答案 0 :(得分:0)
可能的解决方案之一是使用beautiful soup。例如:
html_data = """<li>
<a href="https://ngodarpan.gov.in/index.php/home/statewise_ngo/2569/7/26?per_page=100" data-ci-pagination-page="26">Last</a>
</li>
"""
from bs4 import BeautifulSoup
soup = BeautifulSoup(html_data, 'html.parser')
soup.find('a').get('data-ci-pagination-page')
# 26