我有一个包含奇怪编码字符的文本文件,该文件的原始字符是阿拉伯字符。
作为示例:该文件包含此字符串ÝíæáÇ ãÍÝæÑ
,相当于فيولا محفور
其他一些例子:
ÈÇÑíÜÜÜÜÜÒ = باريـــــز
ÏíäÇ ÔÇÌ = دينا شاج
ßíÑãÇäì ãÍÝæÑ = كيرمانى محفور
ÇäÌì ÈÇáÝæã ãßãáÇÊ = انجى بالفوم مكملات
ÓÈÔíÇá ÑæíÇá 35 ãáã = سبشيال رويال 35 ملم
有没有办法将文件内容恢复为原始的阿拉伯字符?
注意:我使用的是C#编程语言。
答案 0 :(得分:0)
我不太熟悉阿拉伯语编码,但我认为您的文本文件是使用Windows-1256代码页编码的。
因此,您需要在阅读文件时指定此代码页:
var text = File.ReadAllText(pathToFile, Encoding.GetEncoding(1256));