如何使用python拆分解析的html输出?

时间:2017-09-07 23:31:15

标签: python

我有这个HTML

<tr class="BgWhite"> 
 <td headers="th6" valign="top">
    0070648261<br/>QTY: 3
 </td>
</tr>

我想获得&#34; 0070648261&#34;和&#34; 3&#34;分别如ID = 0070648261和数量= 3.我能够使用下面的代码

container1.find("td", {"headers": "th6"}).text.strip() 

生成此输出

   0070648261<br/>QTY: 3

但是如何分割和输出

ID = 0070648261数量= 3?

2 个答案:

答案 0 :(得分:1)

试试这个。

a="0070648261<br/>QTY: 3"
a=a.split("<br/>")
a="ID = "+a[0]+" quantity ="+a[1].split(':')[1]

输出:

'ID = 0070648261 quantity = 3'

答案 1 :(得分:1)

为什么不用正则表达式做到这一点?

import re
s = '<tr class="BgWhite"> <td headers="th6" valign="top">0070648261<br/>QTY: 3</td></tr>'

res = re.findall(r'(\d+)<br/>QTY: (\d+)', s)[0]
print('ID = {} quantity = {}'.format(res[0], res[1]))