从Python中的锚标记内部获取数据

时间:2018-02-07 17:17:17

标签: python

我想从下面的锚标记中提取'26'。我该怎么办?

<li>    
<a href="https://ngodarpan.gov.in/index.php/home/statewise_ngo/2569/7/26?per_page=100" data-ci-pagination-page="26">Last</a>
</li>

1 个答案:

答案 0 :(得分:0)

可能的解决方案之一是使用beautiful soup。例如:

html_data = """<li>    
    <a href="https://ngodarpan.gov.in/index.php/home/statewise_ngo/2569/7/26?per_page=100" data-ci-pagination-page="26">Last</a>
</li>
"""
from bs4 import BeautifulSoup
soup = BeautifulSoup(html_data, 'html.parser')
soup.find('a').get('data-ci-pagination-page')

# 26