从PDF中提取图像及其标签

时间:2016-10-27 12:26:11

标签: image parsing pdf

我在使用pdf文件中的标签(而非元数据!)提取图像时遇到问题。通过标签我的意思是分配给图像的文本来描述它,无论它是在下面还是上面。我已经尝试了很多已知的解析器,如iText,Tika,PDFbox和pdf2html,但我发现无法如何做到这一点。有什么建议吗?

0 个答案:

没有答案