从Google搜索结果中抓取嵌套jsaction数据

时间:2019-07-22 00:28:13

标签: ruby nokogiri screen-scraping

我正在尝试从Google搜索中获取地图列表的地点ID。通常,您可以通过右键单击“写评论”并检查按钮来手动执行此操作。它为您提供了此代码,您只需从中复制“ data-pid”


<a jsaction="r.2E6xSQzb-Xs" data-rtid="iJJkBCXYypbA" jsl="$x 1;" href="javascript:void(0);" id="wrkpb" role="button" style="color:#444;text-decoration:none" class="XQOLg ab_button" data-aspect-feedback-mode="0" data-attribution="lu-desktop-write-review" data-enable-add-photo="true" data-fid="0x89c2f07e39f5823f:0x5cd400a678d9aa37" data-language-code="en-GB" data-maps-rw-api-key="AIzaSyBcv0QfUNUfBwo8pIGJ3teNCkaluSGUWus"


data-pid="ChIJP4L1OX7wwokRN6rZeKYA1Fw" 

data-rr-ui="true" data-session-index="0" data-edit-label-id="Edit your review" data-ved="2ahUKEwj-jOCN1cbjAhXDSBUIHalrBosQgCkwJXoECAwQCg"><span class="qpOrC"><span class="wrsf">Write a review</span></span></a>

现在,当我尝试使用nokogiri打开页面并将此信息刮出时。它甚至不会在文档中看到数据字段“ data-pid”的名称。相反,它会在文档末尾吐出一堆乱码,像这样的东西。

I+X8NuPspCnGsLxUHk5ezKrrc0wUJQ2Ncl3Zpsb9e5HlVeNaZEQfKkuFchY+dWTnJ+HlXq1WtxuQubcDzJaz1zsgeQoqXkJcDZcHMIyE53IpTIjOPDUdRwn7ym26txCm3XEFY6YGK/MTo65CLcVBMsgkAnOR61Q4huUeHoQW1OPrOwb6j1oM3HTCkKuMpxwKWPcdPiST60ALBdXh6L+sR7jxE2/Q+2EKU6SjSlPQHckfZXi62R+StlwlhLWvKlcw6cD0I2NLNj4ow

有没有办法获取我所缺少的数据类型?

0 个答案:

没有答案