我有一个Asp.Net核心项目。这个项目引用了另一个库,我应该从pdf中提取信息。我使用的是itextsharp,但似乎与.net核心不兼容。
知道如何从pdf文件中提取文本吗?
答案 0 :(得分:1)
从PDF中提取文本是一项复杂的任务。如果没有图书馆,我不建议你这样做。
对于Asp.Net核心库,我可以向您推荐Docotic.Pdf library(我为供应商工作)。库supports .NET Standard不仅可用于提取文本,还可用于提取路径和图像。
以下是一些示例:
答案 1 :(得分:0)
如果您想编写自己的pdf解析器,则需要阅读所有不同版本的pdf文件格式。它们都是正式记录的here。