应用错误收集

我必须阅读.pdf文件的内容，我正在使用ITextSharp.net，我有三个问题：

1-阿拉伯语术语以相反的顺序提取。（例如：احمد被提取为دمحا），这是相反的（英文：Ahmad被提取为damha）如果我的文件包含阿拉伯语和英语，如何以正确的方向提取每种语言。

2-有时字形没有被定义为字符，因此它们显示为符号，如何为字形添加我自己的定义？

3-我可以使用其格式提取文本，转换为html并按原样在网页中显示文件吗？