将阿拉伯语中的属性文件转换为unicode

时间:2011-09-06 13:19:27

标签: unicode

我有一个要求,客户端将在阿拉伯语中提供属性文件,我必须将文件(arabic.properties)转换为unicode。该文件包含500多行。请帮助我编写代码将“阿拉伯字符”转换为“unicode字符”。

3 个答案:

答案 0 :(得分:2)

使用命令行转到Java文件夹,然后写:

\Java\bin>native2ascii -encoding utf-8 Labels_ar.txt Labels_ar.properties

<强>更新
不确定你的意思不正确,但尝试这种情况:
打开记事本并用阿拉伯语写一些东西:让我们说:

MyLabel = تجربه1

然后将其另存为test.txt,并确保从编码中选择 UTF-8

现在从命令行:

native2ascii -encoding utf-8 test.txt test_ar.properties

现在test_ar.properties包含:

MyLabel = \u062a\u062c\u0631\u0628\u06471

请注意,有时native2ascii可能会添加\ufeff作为文件中的第一个字符。如果找到它,您需要手动将其删除。

答案 1 :(得分:1)

我猜客户端正在提供codepage 1256 (Windows Arabic)中编码的文件。我进一步猜测,你通过Unicode实际上意味着UTF-8编码。如果这是正确的,那么以下Python 3脚本将执行此操作:

with open("arabic.properties", "r", encoding="cp1256") as infile:
    with open("utf8.properties", "w", encoding="utf-8") as outfile:
        outfile.write(infile.read())

答案 2 :(得分:0)

嗯,首先你必须知道他们要给你的文件的编码。 “阿拉伯字符”可以描述您可能会遇到的单个字素,但是如果没有编码,它就像是训练猫将指甲果冻到树上。 < / p>

运气好的话,他们给你你的一个Unicode编码(UTF-8,UCS-2等),“转换”将相对轻松。