我刚刚开始玩BeautifulSoup,我试图用Python创建一些东西但是当我抓取信息时,标签包含在我不想要的结果中,无论如何我可以从标签中分离产品ID吗?
我的结果示例:
<product-id type="integer">8422899464</product-id>
<product-id type="integer">8422899464</product-id>
<product-id type="integer">8422899464</product-id>
<product-id type="integer">8422899464</product-id>
<product-id type="integer">8422899464</product-id>
<product-id type="integer">8422899464</product-id>
<product-id type="integer">8422899464</product-id>
<product-id type="integer">8422899464</product-id>
<product-id type="integer">8422899464</product-id>
<product-id type="integer">8422899464</product-id>
<product-id type="integer">8422899464</product-id>
<product-id type="integer">8422899464</product-id>
<product-id type="integer">8422899464</product-id>
<product-id type="integer">8422899464</product-id>
<product-id type="integer">8422899464</product-id>
<product-id type="integer">8422899464</product-id>
答案 0 :(得分:3)
如果您想获取product-id:
的数据,请尝试这样的操作data = soup.find('product-id').getText()
print(data)
答案 1 :(得分:2)
[i.text for i in soup('product-id')]
出:
['8422899464',
'8422899464',
'8422899464',
'8422899464',
'8422899464',
'8422899464',
'8422899464',
'8422899464',
'8422899464',
'8422899464',
'8422899464',
'8422899464',
'8422899464',
'8422899464',
'8422899464',
'8422899464']