有没有办法使用pdf.js从pdf文档中获取元数据,如作者或标题?
在此示例中:http://mozilla.github.io/pdf.js/web/viewer.html?file=compressed.tracemonkey-pldi-09.pdf
<div class="row">
<span data-l10n-id="document_properties_author">
Autor:
</span>
<p id="authorField">
-
</p>
并且authorField为空。有没有办法获得这些信息?
答案 0 :(得分:8)
只使用没有第三方查看器的PDF.js库,您可以使用promises获取这样的元数据。
INSERT INTO RESULT
(MAC)
SELECT A.MAC
FROM table1 as A
inner join table2 as B
on A.Email = B.Email2
我在将PDFJS.getDocument(url).then(function (pdfDoc_) {
pdfDoc = pdfDoc_;
pdfDoc.getMetadata().then(function(stuff) {
console.log(stuff); // Metadata object here
}).catch(function(err) {
console.log('Error getting meta data');
console.log(err);
});
// Render the first page or whatever here
// More code . . .
}).catch(function(err) {
console.log('Error getting PDF from ' + url);
console.log(err);
});
对象转储到控制台并查看其功能和属性后发现了这一点。我在原型中找到了这个方法,并决定试一试。瞧,它看起来有效!
答案 1 :(得分:0)
您可以从PDFViewerApplication.documentInfo对象获取文档基本元数据信息。例如:获取作者使用PDFViewerApplication.documentInfo.Author
答案 2 :(得分:0)
试试:
await getDocument(url).promise.then(doc => doc.getMetadata())