如何使用pdf.js从pdf文档中获取元数据

时间:2014-03-30 11:36:11

标签: javascript pdf.js

有没有办法使用pdf.js从pdf文档中获取元数据,如作者或标题?

在此示例中:http://mozilla.github.io/pdf.js/web/viewer.html?file=compressed.tracemonkey-pldi-09.pdf

<div class="row">
<span data-l10n-id="document_properties_author">
    Autor:
</span>
<p id="authorField">
    -
</p>

并且authorField为空。有没有办法获得这些信息?

3 个答案:

答案 0 :(得分:8)

只使用没有第三方查看器的PDF.js库,您可以使用promises获取这样的元数据。

INSERT INTO RESULT
(MAC)
SELECT A.MAC 
FROM table1 as A
inner join table2 as B
on A.Email = B.Email2

我在将PDFJS.getDocument(url).then(function (pdfDoc_) { pdfDoc = pdfDoc_; pdfDoc.getMetadata().then(function(stuff) { console.log(stuff); // Metadata object here }).catch(function(err) { console.log('Error getting meta data'); console.log(err); }); // Render the first page or whatever here // More code . . . }).catch(function(err) { console.log('Error getting PDF from ' + url); console.log(err); }); 对象转储到控制台并查看其功能和属性后发现了这一点。我在原型中找到了这个方法,并决定试一试。瞧,它看起来有效!

答案 1 :(得分:0)

您可以从PDFViewerApplication.documentInfo对象获取文档基本元数据信息。例如:获取作者使用PDFViewerApplication.documentInfo.Author

答案 2 :(得分:0)

试试:

await getDocument(url).promise.then(doc => doc.getMetadata())