标签: itext
使用PdfTextExtractor.GetTextFromPage从PDF文档渲染文本显然非常容易。但是,当处理使用嵌入字体创建的PDF时,我立即偶然发现编码问题。
是否存在可以处理任何字体的通用方法,因为我对pdf的创建方式没有任何控制权。我的任务很简单 - 将pdf转换为文本。
我显然在发布之前搜索了几天但找不到答案。
提前谢谢! ER