如何使用pdfbox从pdf读取文本图像

时间:2019-09-10 12:47:01

标签: c# .net pdfbox

我有一个带图像的PDF文档。该图像包含文本。 现在,我想使用pdfbox从图像中读取文本。

我尝试了PDTTextStripper,但是它不适用于图像文本。 你能给我一些想法吗?

PDDocument pDDocument = PDDocument.load(new java.io.File(fileName));
PDFTextStripper textStripper = new PDFTextStripper();
string text = textStripper.getText(pDDocument);
Console.WriteLine(text);

I want to read the text inside the image from the pdf using pdfbox c# .net.

0 个答案:

没有答案