我在玩草书,但是我还没有弄清楚如何提取想要的文本。
我的解析函数目前看起来像这样
def parse(self, response):
itemList = response.css("#mw-content-text > table.wikitable > tr")
for item in itemList[1:]:
print(item.css("td:nth-child(2)").get())
print(item.css("td:nth-child(2)::text").get())
print(item.css("td:nth-child(2) > span::text").get())
第一个选择item.css("td:nth-child(2)").get()
选择看起来像这样的正确表格单元格
<td> <span class="sortkey" style="display:none"><span style="display:none">000000000000010.0000000000</span>10</span>1 - 10 </td>
现在,我想要此单元格1 - 10
的文本,但是第二个选择器item.css("td:nth-child(2)::text").get()
不返回任何内容。
第三个td:nth-child(2) > span::text").get()
再次工作并返回10
。
我的问题是第二个选择有什么问题,如何获取表格单元格的文本?