无法使用脚本标记内的xpath提取数据

时间:2019-02-18 12:40:48

标签: python html xpath

我正在尝试使用scrapy提取频道的订户数量,并且找到了一个脚本标签,其中包含订户数量,但是当我对其进行测试时,我得到了黑色数据。请帮忙。

split = '\"subscriberCountText\":{\"simpleText\"'
response.xpath("//script[contains(.,'" + split + "')]").extract()

您可以在频道的“关于源代码”页面中搜索文本"subscriberCountText":{"simpleText",但是如何提取它。

1 个答案:

答案 0 :(得分:1)

您需要在此google_api

中添加频道ID

,您将以json格式获取此频道的所有信息。  例如,您给定的频道ID为“ UCqwUrj10mAEsqezcItqvwEw”,则需要将其添加到api的“ id”参数中。最终网址为“ https://www.googleapis.com/youtube/v3/channels?id=UCqwUrj10mAEsqezcItqvwEw&part=snippet%2CcontentDetails%2Cstatistics&key=AIzaSyAWpx46-G9ZByLe8Nk_wqtUekCXvTPM2oI