文本文件错误编码问题

时间:2016-07-13 08:48:30

标签: c# unicode encoding utf-8 character-encoding

我有一个包含奇怪编码字符的文本文件,该文件的原始字符是阿拉伯字符。

作为示例:该文件包含此字符串ÝíæáÇ ãÍÝæÑ,相当于فيولا محفور

其他一些例子:

ÈÇÑíÜÜÜÜÜÒ = باريـــــز
ÏíäÇ ÔÇÌ = دينا شاج
ßíÑãÇäì ãÍÝæÑ = كيرمانى محفور
ÇäÌì ÈÇáÝæã ãßãáÇÊ = انجى بالفوم مكملات
ÓÈÔíÇá ÑæíÇá 35 ãáã = سبشيال رويال 35 ملم

有没有办法将文件内容恢复为原始的阿拉伯字符?

注意:我使用的是C#编程语言。

1 个答案:

答案 0 :(得分:0)

我不太熟悉阿拉伯语编码,但我认为您的文本文件是使用Windows-1256代码页编码的。

因此,您需要在阅读文件时指定此代码页:

var text = File.ReadAllText(pathToFile, Encoding.GetEncoding(1256));