ScriptDb减少查询

时间:2013-03-09 23:29:32

标签: google-apps-script

我有一个存储大量数据的函数,然后在存储更多数据之前检查重复项的数据。查询每个重复检查的数据库会导致脚本超过最大执行时间,因此查询整个数据库,然后检查该查询。问题是,当我通过重复检查时,查询大小在第4次传递时减少到零,使其无效。以下是存储功能和重复检查的代码:

function ssToScriptDb_1() {
  var spreadsheet = SpreadsheetApp.openById('0Ah1c1zmu5vU_dEZJYVMzVnF6Y211cmJGdjZBUGFLQWc');  // **** create a function to prompt for the ID
  var sheet = spreadsheet.getActiveSheet();
  var columns = spreadsheet.getLastColumn();
  var data = sheet.getDataRange().getValues();
  var keys = data[0];
  var db = ScriptDb.getMyDb();
  var allDb = db.query({});
  var items = [];
  for (var row = 1; row < data.length; row++) {
    var rowData = data[row];
    var item = {};
    for (var column = 0; column < keys.length; column++) {
      item[keys[column]] = rowData[column];  // ???? could I use this notation in place of the double for loops in timeClock?
    }
    item.visitDate = Utilities.formatDate(item.visitDate, "MST", "M/d/yyyy");

    // check to see if the item is already in the db
    if (dupCheck(db, allDb, item)) {
      items.push(item);
    }
    if (row % 1000 == 0) {
      Logger.log("row " + row + " completed at " + new Date() +"\n");
    }
  }

  var itemsLen = items.length;
  Logger.log('DB save start time ' + new Date() + '\n');
  var results = db.saveBatch(items, false);
  Logger.log('DB save end time ' + new Date() + '\n');
}

function dupCheck(db, query, item) {
  var count = 0;
  var querySize = query.getSize();
  var query2Size = db.query({}).getSize();
  while (query.hasNext()) {
    var ob = query.next();
    if (ob.ID == item.ID && ob.email == item.email && ob.visitDate == item.visitDate) {
      return false;
    }
    count++;
  }
  return true;
}

调试中第一次通过dupCheck()看起来像这样: dupCheck() pass 1

请注意querySize是在输入dupCheck()之前完成的查询,而query2Size是在dupCheck()内完成的同一查询。

这是第二次通过dupCheck()dupCheck() pass 2

这是第4遍: dupCheck() pass 4

再次注意querySize vs query2Size

我不知道导致原始查询减少的原因是什么,但我不能为每个项目调用查询,不知道是什么导致了这个或者有更好的解决方案?

1 个答案:

答案 0 :(得分:0)

我明白了。我没有意识到query.next()正在改变查询。为了达到我的需要,我将查询结果放在一个数组中,并检查数组的重复项。