我想识别pdf文件中的表格。在C#中使用什么SDK来识别pdf中的表格以及逐个单元格读取的一些机制,请问任何人都可以建议吗?
答案 0 :(得分:1)
PDF Sharp很好而且免费。我从来没有这样做过具体但它确实与PDF格式的所有主要对象相关。
答案 1 :(得分:1)
PDF在结构中不存在作为结构的表,除非它被创建为带有附加标记的标记内容。我写了一篇博客文章,解释了http://www.jpedal.org/PDFblog/2009/04/pdf-text/
从PDF文件中提取文本的一些问题