我有一个包含单个单词的文本文件,但它使用的是语言:阿拉伯语 我想提取它
我的代码是:
string text = System.IO.File.ReadAllText(@"C:\CINPROCESSING\nom.txt");
Console.WriteLine(text );
我的结果是未知字符:????
我如何解决它?
谢谢,
答案 0 :(得分:2)
为您的文字设置代码页。
System.IO.File.ReadAllText(@"C:\CINPROCESSING\nom.txt",System.Text.Encoding.GetEncoding(codepage))
可能是codepage = 1256(windows-arabic)。
答案 1 :(得分:1)
您的代码会将文本正确地读入变量text
。 (调试并参见)
但是,在Windows控制台中显示不同的阿拉伯字符是另一个问题(检查如何解决它Here)
答案 2 :(得分:1)
您可以尝试以下操作: 字符串文本= System.IO.File.ReadAllText(@“ C:\ CINPROCESSING \ nom.txt”,Encoding.Default); Console.WriteLine(text);
答案 3 :(得分:0)
尝试使用此StreamReader构造函数指定编码:
StreamReader arabic_reader = new StreamReader(filePath, System.Text.Encoding.UTF8, true);
OR
string text = System.IO.File.ReadAllText(@"C:\CINPROCESSING\nom.txt",Encoding.UTF8);
答案 4 :(得分:0)
尝试:
StreamReader reader = new StreamReader(filePath, System.Text.Encoding.UTF8, true);