标签: image parsing pdf
我在使用pdf文件中的标签(而非元数据!)提取图像时遇到问题。通过标签我的意思是分配给图像的文本来描述它,无论它是在下面还是上面。我已经尝试了很多已知的解析器,如iText,Tika,PDFbox和pdf2html,但我发现无法如何做到这一点。有什么建议吗?