使用UrlFetchApp在Google Apps脚本中提取表格

时间:2016-07-30 07:06:18

标签: google-apps-script google-sheets

我想从以下链接导入值: NSE

我尝试过以下代码:

function extract() {
  var html = UrlFetchApp.fetch('nseindia.com/live_market/dynaContent/live_watch/option_chain/optionKeys.jsp?symbol=NIFTY').getContentText();
  var doc = XmlService.parse(html);
  var html = doc.getRootElement();
  var menu = getElementsByClassName(html, 'opttbldata')[0];
  var output = '';
  var linksInMenu = getElementsByTagName(menu, 'th');
  for(i in linksInMenu) output+= XmlService.getRawFormat().format(linksInMenu[i])+'<br>';
  return HtmlService.createHtmlOutput(output);
  //Logger.log(menu);
};


function getElementById(element, idToFind) {  
  var descendants = element.getDescendants();  
  for(i in descendants) {
    var elt = descendants[i].asElement();
    if( elt !=null) {
      var id = elt.getAttribute('id');
      if( id !=null && id.getValue()== idToFind) return elt;    
    }
  }
};


function getElementsByClassName(element, classToFind) {  
  var data = [];
  var descendants = element.getDescendants();
  descendants.push(element);  
  for(i in descendants) {
    var elt = descendants[i].asElement();
    if(elt != null) {
      var classes = elt.getAttribute('class');
      if(classes != null) {
        classes = classes.getValue();
        if(classes == classToFind) data.push(elt);
        else {
          classes = classes.split(' ');
          for(j in classes) {
            if(classes[j] == classToFind) {
              data.push(elt);
              break;
            }
          }
        }
      }
    }
  }
  return data;
};


function getElementsByTagName(element, tagName) {  
  var data = [];
  var descendants = element.getDescendants();  
  for(i in descendants) {
    var elt = descendants[i].asElement();     
    if( elt !=null && elt.getName()== tagName) data.push(elt);      
  }
  return data;
};

但是我收到以下错误:
返回代码403.截断的服务器响应:访问被拒绝

访问被拒绝

您无权访问&#34; http:// nseindia&amp;#...(使用muteHttpExceptions检查完整响应的选项)(第2行,文件&#34;代码&#34;)

1 个答案:

答案 0 :(得分:1)

该网站检查用户代理拒绝来自任何非浏览器的请求。遗憾的是,应用程序脚本不允许您更改用户代理,因此您无法使用UrlFetchApp加载该网站,除非您设法使用允许伪造用户代理的代理服务器。