Question

我正在尝试抓取一个包含多个tr标记的网页，其代码以news开头。

id的名称为：

news1

news2

news3 ......等等。

随着新闻足够的ID数量的变化。我希望我的代码具有灵活性。因此能够使用通配符进行搜索会很棒。

我将如何编写此代码？

newsItems = soupified_page.find_all('tr', id='news')

Answer 1

只需获取所有tr并检查其ID：

newsItems = [item for item in soupified_page.find_all('tr') if item['id'].startswith('news')]