与beautifulsoup擦桌子

时间:2014-03-05 10:34:48

标签: python beautifulsoup

我好像被卡住了,如果我有下表:

<table align=center cellpadding=3 cellspacing=0 border=1>
<tr bgcolor="#EEEEFF">
   <td align="center">
   40   </td>
   <td align="center">
   44   </td>
   <td align="center">
   <font color="green"><b>+4</b></font>
   </td>
   <td align="center">
   1,000</td>
   <td align="center">
   15,000   </td>
   <td align="center">
   44,000   </td>
   <td align="center">
   <font color="green"><b><nobr>+193.33%</nobr></b></font>
   </td>

</tr> 

使用find_all从表中拉出44,000 td的理想方法是什么?

1 个答案:

答案 0 :(得分:1)

如果它是桌子的重复位置,你想要刮去你想刮,我会用漂亮的汤来提取表中的所有元素,然后提取数据。请参阅下面的伪代码。

known_position = 5
tds = bs4.find_all('td')
number = tds[known_position].text()
另一方面,如果您专门搜索给定的数字,我会迭代列表。

tds = bs4.find_all('td')
for td in tds:
    if td.text = 'number here':
        # do your stuff