如何用Python从字符串中提取一些信息?

时间:2016-12-26 12:33:44

标签: python beautifulsoup

我刚刚开始玩BeautifulSoup,我试图用Python创建一些东西但是当我抓取信息时,标签包含在我不想要的结果中,无论如何我可以从标签中分离产品ID吗?

我的结果示例:

<product-id type="integer">8422899464</product-id>
<product-id type="integer">8422899464</product-id>
<product-id type="integer">8422899464</product-id>
<product-id type="integer">8422899464</product-id>
<product-id type="integer">8422899464</product-id>
<product-id type="integer">8422899464</product-id>
<product-id type="integer">8422899464</product-id>
<product-id type="integer">8422899464</product-id>
<product-id type="integer">8422899464</product-id>
<product-id type="integer">8422899464</product-id>
<product-id type="integer">8422899464</product-id>
<product-id type="integer">8422899464</product-id>
<product-id type="integer">8422899464</product-id>
<product-id type="integer">8422899464</product-id>
<product-id type="integer">8422899464</product-id>
<product-id type="integer">8422899464</product-id>

2 个答案:

答案 0 :(得分:3)

如果您想获取product-id:

的数据,请尝试这样的操作
data = soup.find('product-id').getText()
print(data)

答案 1 :(得分:2)

[i.text for i in soup('product-id')]

出:

['8422899464',
 '8422899464',
 '8422899464',
 '8422899464',
 '8422899464',
 '8422899464',
 '8422899464',
 '8422899464',
 '8422899464',
 '8422899464',
 '8422899464',
 '8422899464',
 '8422899464',
 '8422899464',
 '8422899464',
 '8422899464']