标签: c# pdf itext
我必须阅读.pdf文件的内容,我正在使用ITextSharp.net, 我有三个问题:
1-阿拉伯语术语以相反的顺序提取。(例如:احمد被提取为دمحا),这是相反的(英文:Ahmad被提取为damha) 如果我的文件包含阿拉伯语和英语,如何以正确的方向提取每种语言。
2-有时字形没有被定义为字符,因此它们显示为符号,如何为字形添加我自己的定义?
3-我可以使用其格式提取文本,转换为html并按原样在网页中显示文件吗?