Google应用脚本用于从网页抓取数据

时间:2013-02-22 16:19:41

标签: text google-apps-script spreadsheet pull

我之前帮助创建了这个脚本会将玩家数量从网站上拉下来并将其记录到带有日期和时间戳的电子表格中,这是:

function pullRuneScape() {
  var page = UrlFetchApp.fetch('http://runescape.com/title.ws').getContentText();
  var number = page.match(/PlayerCount.*>([0-9,]+)</)[1];
  SpreadsheetApp.getActive().getSheetByName('RuneScape').appendRow([new Date(), number]);
}

基本上在网页上他们列出了玩家的数量,我想每隔5分钟左右登录一次,但他们还有另一个网站,我想从中获取数字,我需要一些帮助。

它在http://oldschool.runescape.com/slu

我想抓住该网站顶部的玩家数量,然后像我在这里一样记录:https://docs.google.com/spreadsheet/ccc?key=0AjrAPynUEUl9dGtIZFY0TlRFUllVcWFyZDZ2c2o5Tnc#gid=0

其中A列是日期和时间,而B只是人数,所以输出就像1/1/2013 0:00:48 77,439

感谢您的帮助。

1 个答案:

答案 0 :(得分:3)

阅读有关如何使用正则表达式的信息。这将帮助您弄清楚此代码正在做什么。请不要只复制我在下面发布的代码。在Stack Overflow,我们不会为您编写代码;如果出现问题,我们会帮助您。

var page = UrlFetchApp.fetch('http://oldschool.runescape.com/slu').getContentText();
var number = page.match(/There are currently ([0-9,]+)/)[1];