标签: javascript image text extraction pdf.js
您好我正在编写一个应用程序,我正在解析pdf文件并获取特定文本并从中创建一个csv文件。
为此我使用pdf.js!
我编写了一个过滤方法,用于从api.js的 internalRenderTask.operatorList.argsArray 中提取文本(在调用Render函数时调用)。但是我认为必须有一种更好的方法来直接使用一些方法调用来获取文本和图像,所以如果你们使用了pdf.js方法或者有更好的方法,请提出相同的建议。
感谢。