应用错误收集

在Net Core中解析pdf

时间：2017-04-18 17:15:19

标签： pdf asp.net-core .net-core

我有一个Asp.Net核心项目。这个项目引用了另一个库，我应该从pdf中提取信息。我使用的是itextsharp，但似乎与.net核心不兼容。

知道如何从pdf文件中提取文本吗？

2 个答案:

答案 0 :(得分：1)

从PDF中提取文本是一项复杂的任务。如果没有图书馆，我不建议你这样做。

对于Asp.Net核心库，我可以向您推荐Docotic.Pdf library（我为供应商工作）。库supports .NET Standard不仅可用于提取文本，还可用于提取路径和图像。

以下是一些示例：

答案 1 :(得分：0)

如果您想编写自己的pdf解析器，则需要阅读所有不同版本的pdf文件格式。它们都是正式记录的here。