在Net Core中解析pdf

时间:2017-04-18 17:15:19

标签: pdf asp.net-core .net-core

我有一个Asp.Net核心项目。这个项目引用了另一个库,我应该从pdf中提取信息。我使用的是itextsharp,但似乎与.net核心不兼容。

知道如何从pdf文件中提取文本吗?

2 个答案:

答案 0 :(得分:1)

从PDF中提取文本是一项复杂的任务。如果没有图书馆,我不建议你这样做。

对于Asp.Net核心库,我可以向您推荐Docotic.Pdf library(我为供应商工作)。库supports .NET Standard不仅可用于提取文本,还可用于提取路径和图像。

以下是一些示例:

答案 1 :(得分:0)

如果您想编写自己的pdf解析器,则需要阅读所有不同版本的pdf文件格式。它们都是正式记录的here