您好我正试图抓住这个网页并将其存储到一张桌子......任何桌子。我正在使用Google脚本。
var fetchString="http://www.airchina.com.cn/www/en/html/index/ir/traffic/"
var response = UrlFetchApp.fetch(fetchString);
我需要一些关于代码的帮助才能启动它。我想抓住“交通数据”表。如果可能的话,我想把它放到一个2D数组中。
答案 0 :(得分:7)
Google提供XML parsing/manipulating service。您可以使用它来解析该表中的html。
一个注意事项,如果您调查html实际来自哪里,您会发现它实际上来自不同的网址。 http://www.airchina.com.cn/www/jsp/airlines_operating_data/exlshow_en.jsp
所以这就是我得到的。它工作得很好。希望这对你来说已经足够了。
function fetchIt() {
var fetchString="http://www.airchina.com.cn/www/jsp/airlines_operating_data/exlshow_en.jsp"
var response = UrlFetchApp.fetch(fetchString);
var xmlDoc = Xml.parse(response.getBlob().getDataAsString(),true);
var b = xmlDoc.getElement().getElement("body");
var table = b.getElement("div").getElement("div").getElement("div").getElements("div")[1].getElement("table");
var rows = [];
var trs = table.getElements("tr");
for (var r=0,rlength=trs.length; r<rlength; r++) {
var tds = trs[r].getElements("td");
var row = [];
for (var c=0,clength=tds.length; c<clength; c++) {
row.push(tds[c].getText());
}
rows.push(row);
}
Logger.log(Utilities.jsonStringify(rows));
}