我试图从basketball-reference.com抓取数据,我注意到实际注释掉的部分源文件显示在网站上。
这是指该网站的链接:
https://www.basketball-reference.com/players/j/jamesle01.html
视图源:https://www.basketball-reference.com/players/j/jamesle01.html
表中显示了不同类别的统计信息,但由于某种原因,只有" Per Game"类别实际上没有被注释掉,请参阅从第864行开始的部分是包含实际数据的位置。 对于其他类别,包含数据的标签都已注释掉,请参阅例如第1191行为" Total" "每36分钟"类别或行1278类别。
我正在使用scrapy,并且在xpath中无法从注释代码中提取任何标记。
有人能告诉我代码是如何在网站上显示的 是否可以从XPath中的注释中提取标签?