我正在尝试抓取一个包含多个tr
标记的网页,其代码以news
开头。
id的名称为:
news1
news2
news3
......等等。
随着新闻足够的ID数量的变化。我希望我的代码具有灵活性。因此能够使用通配符进行搜索会很棒。
我将如何编写此代码?
newsItems = soupified_page.find_all('tr', id='news')
答案 0 :(得分:0)
只需获取所有tr
并检查其ID:
newsItems = [item for item in soupified_page.find_all('tr') if item['id'].startswith('news')]