如何为x-ray npm webscrapping指定语言?

时间:2016-08-20 16:42:58

标签: node.js npm web-scraping x-ray

问题的主题

E.g。我想从游戏市场上刮一本书页。 Google市场有多种语言版本,没有特定于网址的标记。那么,我如何用我需要的语言而不是随机语言来刮取特定版本呢?

环境

" x-ray":" ^ 2.2.0"
node --version:5.9.0
npm --version:3.7.3

重现的步骤

尝试从游戏市场中抓取任何页面。这个例如: https://play.google.com/store/books/details/Walter_Isaacson_Steve_Jobs?id=I6R8MXStPXgC

预期行为

使用特定语言废弃了网页

实际行为

它刮掉随机语言(瑞典语,西班牙语,portuges - 所有这一切,而我从同一个VPS运行x射线)

1 个答案:

答案 0 :(得分:0)

您可以使用查询字符串参数“hl”来定义双字母语言代码。因此,要以中文显示页面,请使用url:

https://play.google.com/store/books/details/Walter_Isaacson_Steve_Jobs?id=I6R8MXStPXgC&hl=zh

请注意& hl = zh 会附加到原始网址。