是否可以使用可变列表刮取网页?

时间:2018-02-02 09:08:42

标签: web-scraping

早上好, 我从网上获取信息来提供一大堆产品,我遇到了下一个我无法解决的问题。我需要的数据是在tbody中,在tr中我可以将这些情况作为示例

<tr id="2">
<td class="tlin" valign="top" align="left"><nobr>1</nobr></td>
<td class="tlin" valign="top" align="right">2</td>
<td class="tlin" valign="top" align="center"><nobr>3</nobr></td>
<td class="tlin" valign="top" align="center"><nobr>4</nobr></td>
<td class="tlin" valign="top" align="center"><nobr>5</nobr></td>
<td class="tlin" valign="top" align="center"><nobr>6</nobr></td>
<td class="tlin" valign="top" align="center"><nobr>7</nobr></td>
<td class="tlin" valign="top" align="center"><nobr>8</nobr></td>
<td class="tlin" valign="top" align="center"><nobr>9</nobr></td>
<td class="tlin" valign="top" align="right">11</td>
<td class="tlin" valign="top" align="right">12</td>
</tr>

<tr id="x">
<td class="tlin" valign="top" align="left">1<nobr></nobr></td>
<td class="tlin" valign="top" align="right">2</td>
<td class="tlin" valign="top" align="center"><nobr>3</nobr></td>
<td class="tlin" valign="top" align="center"><nobr>4</nobr></td>
<td class="tlin" valign="top" align="center"><nobr>5</nobr></td>
<td class="tlin" valign="top" align="center"><nobr>6</nobr></td>
<td class="tlin" valign="top" align="right">7</td>
<td class="tlin" valign="top" align="right">8</td>
<td class="tlin" valign="top" align="right">9</td>
<td class="tlin" valign="top" align="center"><nobr>10</nobr></td>
<td class="tlin" valign="top" align="center"><nobr>11</nobr></td>
<td class="tlin" valign="top" align="center"><nobr>12</nobr></td>
<td class="tlin" valign="top" align="right">13</td>
<td class="tlin" valign="top" align="right">14</td>
</tr>

即,列数不固定。并且我无法控制何时更改列,因为所有被称为拉同一类。有谁知道如何减轻它?由于产品超过60,000

,手工操作可能会更加糟糕

由于

0 个答案:

没有答案