如何从c#中的波斯语pdf文件中读取

时间:2018-02-26 13:38:49

标签: c# pdf itext

我想阅读波斯语pdf

我的代码在这里

>>> a={}
>>> b={}
>>> print(a)
{}
>>> print(b)
{}
>>> a['x']='x'
>>> print(a)
{'x': 'x'}
>>> print(b)
{}

并像这里一样输出

  

˚F   Giti Resan Kala   VTF   rrtrD ,,   "房颤   JiJ 9 J.os   S.F,1rir   OtOyU.:suN3   \ Yltl \ / Yl   ,tlJ q oS)9   6' 1-   JU   \ vt-Af   。 yy6   \ F   :(:。)a U1U o。,t-o.I,   :a; l olLo *!   \ 44 .... r(pt' 1lJ)6.19   \ ftAyrA   :lUlua *我   \ \F   :aJ.fj ct.u。,。   fq,fA o.:to f   9   我{i   ..,AI,"。R /,$ {,,   *   你是Af   :rij *:。o o; h * i   ..   1,:J-   ,A 1 ... f.A. ÿ   tA 1 ... YYf f。   t 41 ... f r.1。   HADI BARGHAMADI   ,Al ... t1rfA VA] IHEI,I RAMESHK   rA 1 ... YYY我   SEVDA HOBEVATAN   DADEHVARZI   无线组合   tA 1 ... YY1.1   先生。 BAIIRAM   FARAJI BAZARGANI   ,A 1 ... rf.rl   ,A \ ,,, Y f,?f   TAL ... Yf.tf   tAl ... Yr.rv   2 ^ ..,Y?中,Ra   ,A 1 ... Yf,Y。   tAl ... rf。义   是的......是的。   YY   TA'的... rf.vf   ,A 1 ... rf。 VA   ,Al ... Yf。   VT   \,TA \   QLT   6rl我   QXP

pdf存在于以下网址

http://bre-shop.com/images/114d1.pdf

1 个答案:

答案 0 :(得分:1)

这看起来像一个垃圾为文本的OCR文档。它可能是用西方语言的OCR解码的,换句话说,OCR不知道波斯语。