使用通配符查找所有id

时间:2017-01-23 19:39:28

标签: python html python-3.x beautifulsoup

我正在尝试抓取一个包含多个tr标记的网页,其代码以news开头。

id的名称为:

news1

news2

news3 ......等等。

随着新闻足够的ID数量的变化。我希望我的代码具有灵活性。因此能够使用通配符进行搜索会很棒。

我将如何编写此代码?

newsItems = soupified_page.find_all('tr', id='news')

1 个答案:

答案 0 :(得分:0)

只需获取所有tr并检查其ID:

newsItems = [item for item in soupified_page.find_all('tr') if item['id'].startswith('news')]