如何通过Google脚本获取Google文档中的页面数量(转换为PDF格式时)?
我试过这个,但它返回0而不是页数。
function getNumPages()
{
var blob = DocumentApp.getActiveDocument().getAs("application/pdf");
var data = blob.getDataAsString();
var re = /Pages\/Count (\d+)/g;
var match;
var pages = 0;
while(match = re.exec(data)) {
Logger.log("MATCH = " + match[1]);
var value = parseInt(match[1]);
if (value > pages) {
pages = value;
}
}
Logger.log("pages = " + pages);
return pages;
}
答案 0 :(得分:4)
您的正则表达式需要PDF文件中的Pages/Count 3
字符串。使用Logger.log(data)
记录文件的内容表明没有这样的字符串。相反,我发现文件开头附近的页数:
<< /Linearized 1 /L 18937 /H [ 687 137 ] /O 10 /E 17395 /N 3 /T 18641 >>
以下数字/ N是页数。这是一个提取它的函数:
function getNumPages() {
var blob = DocumentApp.getActiveDocument().getAs("application/pdf");
var data = blob.getDataAsString();
var pages = parseInt(data.match(/ \/N (\d+) /)[1], 10);
Logger.log("pages = " + pages);
return pages;
}
答案 1 :(得分:-1)
function getNumPages(docId) {
var pages = 0;
var blob = DocumentApp.openById(docId).getAs("application/pdf");
var data = blob.getDataAsString();
try {
var matched = data.match(/\/Type[\s]*\/Page[^s]/g);
pages = matched.length;
} catch(err) {
// NOOP
}
return pages;
}