我正在尝试从At The Races网站上搜索赛马结果的数据。我希望能够包括马名,马厩,赛马/训练师名称,价格,年龄,体重,挨打。
我可以通过简单的命令获得所有这些:
我在汤中选择('td'): 打印(i.text)
但是,我会看到如下数据,但它还包含我不需要的注释,我真的需要它可以导出到csv的格式。
我试图用一行代码来打破这个代码:
results = soup.find_all('tr',attrs = {'class':'data-number'})
但是,这只会返回零结果。
下面是网站本身的一些HTML代码的副本:
<tr class="" data-number="2" data-draw="7" data-horsename="Attain" data-form="116423" data-weightvaluecloth="152997" data-jockeyname="Mr S Walker"><!--
HorseID: 2706434--><td class="number-draw"><span>1</span></td>
<td class="distance">
</td>
<td class="horse">
<div><img class="silk" src="http://data.attheraces.com/images/silks/20180602/20180602lin174002.png" alt="Grey, light blue seams, light blue cap (Boadicea Bloodstock)
 " data-tooltip="Grey, light blue seams, light blue cap (Boadicea Bloodstock)
 " data-style="white"><h3><span class="cloth-number">2.
</span><a href="/form/horse/Attain/GB/2706434?raceid=1039123" target="" data-popup="/form-popup/horse/Attain/GB/2706434?raceid=1039123" class="name summary form-link horse-form-link" data-tooltip="Attain historical data/form" data-style="white tooltip-wide" data-touch="false">Attain</a>
(7)
<a class="horse-tracker-link" href="/horsetracker/add/2706434" data-style="white" data-tooltip="Add Attain to your tracked horses" onclick="LoadHorseTrackerDialog(this); return false;" data-horseid="2706434" data-horsename="Attain" data-comment=""><i class="icon-tracker"></i></a></h3>
<p class="closeup">mid-division, headway well over 1f out, soon chasing leaders, led inside final furlong, ran on</p>
</div>
</td>
<td class="starting-price"><span title="op 10/3">5/2 Fav</span></td>
<td class="age-weight"><span class="age">9</span> <span class="weight">10-12</span> <span class="headgear"></span></td>
<td class="official-rating"><span class="icon-text-steel or" data-tooltip="
 <strong>Official Rating: 67</strong>
 " data-style="white">67</span></td>
<td class="jockey-trainer"><a href="
 /form/jockey/Mr-S-Walker/1001848?formtype=jockey&raceid=1039123" data-popup="
 /form-popup/jockey/Mr-S-Walker/1001848?formtype=jockey&raceid=1039123" class="jockey form-link"><span data-tooltip="Click to view more form for Mr S Walker" data-style="white">Mr S
Walker</span></a><a href="/form/trainer/Archie-Watson/1479716?formtype=trainer&raceid=1039123" target="" data-popup="/form-popup/trainer/Archie-Watson/1479716?formtype=trainer&raceid=1039123" class="trainer form-link"><span data-tooltip="Click to view more form for Archie Watson" data-style="white">Archie Watson</span></a></td>
</tr>
我是一个完整的新手,所以任何帮助或建议都非常感谢。
1
2。 达到 (7)
中段,前进远远超过1f,很快追逐领先者,领导最后的弗隆,继续5/2 Fav 9 10-12 67 S Walker先生Arg Watson先生 2 5
6。 Muthraab Aldaar (IRE)
(4)
被追踪的领导者,领先1f出局,很快就左转,最终在弗隆面前,没有跑上
11/1 5 9-11 p 59 史蒂文斯小姐(7)J R Boyle 3 ½
1。 黑凯撒 (IRE)
(5)
直到超过1f,很快反弹,削弱了收盘阶段
3/1 2Fav 7 10-7 69 M E Spencer小姐(7)P Hide 4 1.5
7。 边缘 (IRE)
(1)
朝着后方举起,超过1f,在最后的弗隆内追逐领袖,永远无法挑战
6/1 7 10-2 b 57 R BirkettB J Llewellyn先生 五 1