Question

我在玩草书，但是我还没有弄清楚如何提取想要的文本。

我的解析函数目前看起来像这样

def parse(self, response):
        itemList = response.css("#mw-content-text > table.wikitable > tr")
        for item in itemList[1:]:
            print(item.css("td:nth-child(2)").get())
            print(item.css("td:nth-child(2)::text").get())
            print(item.css("td:nth-child(2) > span::text").get())

第一个选择item.css("td:nth-child(2)").get()选择看起来像这样的正确表格单元格

<td> <span class="sortkey" style="display:none"><span style="display:none">000000000000010.0000000000</span>10</span>1 - 10 </td>

现在，我想要此单元格1 - 10的文本，但是第二个选择器item.css("td:nth-child(2)::text").get()不返回任何内容。

第三个td:nth-child(2) > span::text").get()再次工作并返回10。

我的问题是第二个选择有什么问题，如何获取表格单元格的文本？

Scrapy-从表中提取文本

0 个答案: