我有一个存储大量数据的函数,然后在存储更多数据之前检查重复项的数据。查询每个重复检查的数据库会导致脚本超过最大执行时间,因此查询整个数据库,然后检查该查询。问题是,当我通过重复检查时,查询大小在第4次传递时减少到零,使其无效。以下是存储功能和重复检查的代码:
function ssToScriptDb_1() {
var spreadsheet = SpreadsheetApp.openById('0Ah1c1zmu5vU_dEZJYVMzVnF6Y211cmJGdjZBUGFLQWc'); // **** create a function to prompt for the ID
var sheet = spreadsheet.getActiveSheet();
var columns = spreadsheet.getLastColumn();
var data = sheet.getDataRange().getValues();
var keys = data[0];
var db = ScriptDb.getMyDb();
var allDb = db.query({});
var items = [];
for (var row = 1; row < data.length; row++) {
var rowData = data[row];
var item = {};
for (var column = 0; column < keys.length; column++) {
item[keys[column]] = rowData[column]; // ???? could I use this notation in place of the double for loops in timeClock?
}
item.visitDate = Utilities.formatDate(item.visitDate, "MST", "M/d/yyyy");
// check to see if the item is already in the db
if (dupCheck(db, allDb, item)) {
items.push(item);
}
if (row % 1000 == 0) {
Logger.log("row " + row + " completed at " + new Date() +"\n");
}
}
var itemsLen = items.length;
Logger.log('DB save start time ' + new Date() + '\n');
var results = db.saveBatch(items, false);
Logger.log('DB save end time ' + new Date() + '\n');
}
function dupCheck(db, query, item) {
var count = 0;
var querySize = query.getSize();
var query2Size = db.query({}).getSize();
while (query.hasNext()) {
var ob = query.next();
if (ob.ID == item.ID && ob.email == item.email && ob.visitDate == item.visitDate) {
return false;
}
count++;
}
return true;
}
调试中第一次通过dupCheck()
看起来像这样:
请注意querySize
是在输入dupCheck()
之前完成的查询,而query2Size是在dupCheck()
内完成的同一查询。
这是第二次通过dupCheck()
:
这是第4遍:
再次注意querySize
vs query2Size
。
我不知道导致原始查询减少的原因是什么,但我不能为每个项目调用查询,不知道是什么导致了这个或者有更好的解决方案?
答案 0 :(得分:0)
我明白了。我没有意识到query.next()
正在改变查询。为了达到我的需要,我将查询结果放在一个数组中,并检查数组的重复项。