我正在使用网络抓取,从表格行中读取数据。 html结构如下所示。每行都有几列(突出显示的列),我需要从中提取数据。我选择了以下行:
convert barn.jpg -colorspace gray -write mpr:img +delete \
mpr:img \( mpr:img \( -size 1x1 xc:black xc:red xc:white +append -size 1x256 gradient: -rotate 90 +swap -interpolate Bicubic -clut \) -interpolate Bicubic -clut \) mask1.png -compose over -composite -write mpr:img +delete \
mpr:img \( mpr:img \( -size 1x1 xc:black xc:green1 xc:white +append -size 1x256 gradient: -rotate 90 +swap -interpolate Bicubic -clut \) -interpolate Bicubic -clut \) mask2.png -compose over -composite -write mpr:img +delete \
mpr:img \( mpr:img \( -size 1x1 xc:black xc:blue xc:white +append -size 1x256 gradient: -rotate 90 +swap -interpolate Bicubic -clut \) -interpolate Bicubic -clut \) mask3.png -compose over -composite -write mpr:img +delete \
mpr:img \( mpr:img \( -size 1x1 xc:black xc:yellow xc:white +append -size 1x256 gradient: -rotate 90 +swap -interpolate Bicubic -clut \) -interpolate Bicubic -clut \) mask4.png -compose over -composite \
result8.jpg
因此列表中的每个项目(i)都显示整行。现在,我想访问突出显示的标签内的信息。如果我执行print(i.td),则仅打印下一个td标签。如何访问内部的标签及其属性?
答案 0 :(得分:1)
与查找行几乎相同。
for col in i.find_all('td'):
if 'class' in td:
print(td['class'])
if 'ng-repeat' in td:
print(td['ng-repeat'])