这是我尝试制作抓取工具的页面(http://www.bobaedream.co.kr/mycar/popup/mycarChart_4.php?zone=C&cno=639137&tbl=cyber)。问题是从下面的图像中收集数据:
这些部件由' tr'每个项目的标签。我想做的是让它在上半部分和下半部分分开,并收集每个列表的数据,包括检查的计数。然后,最后打印出如下格式:
<li><i class="icon-caret-right"></i>textone</li>
<li class="stack"><i class="icon-caret-right"></i>texttwo</li>
<li><i class="icon-caret-right"></i>textthree</li>
<li><i class="icon-caret-right"></i>textfour</li>
我的代码如下:
<Upper Part>
1 후드 0 0
2 프론트 휀더(좌) 0 0
......
8 트렁크 리드 1 0
Total : 1 0
<Lower Part>
1 프론트 패널
2 크로스 멤버
....
22 리어 패널 1 0
23 트렁크 플로어 0 0
Total : 1 0
请帮我解决这个问题。