我有一个要求,客户端将在阿拉伯语中提供属性文件,我必须将文件(arabic.properties)转换为unicode。该文件包含500多行。请帮助我编写代码将“阿拉伯字符”转换为“unicode字符”。
答案 0 :(得分:2)
使用命令行转到Java文件夹,然后写:
\Java\bin>native2ascii -encoding utf-8 Labels_ar.txt Labels_ar.properties
<强>更新强>
不确定你的意思不正确,但尝试这种情况:
打开记事本并用阿拉伯语写一些东西:让我们说:
MyLabel = تجربه1
然后将其另存为test.txt,并确保从编码中选择 UTF-8 。
现在从命令行:
native2ascii -encoding utf-8 test.txt test_ar.properties
现在test_ar.properties包含:
MyLabel = \u062a\u062c\u0631\u0628\u06471
请注意,有时native2ascii可能会添加\ufeff
作为文件中的第一个字符。如果找到它,您需要手动将其删除。
答案 1 :(得分:1)
我猜客户端正在提供codepage 1256 (Windows Arabic)中编码的文件。我进一步猜测,你通过Unicode实际上意味着UTF-8编码。如果这是正确的,那么以下Python 3脚本将执行此操作:
with open("arabic.properties", "r", encoding="cp1256") as infile:
with open("utf8.properties", "w", encoding="utf-8") as outfile:
outfile.write(infile.read())
答案 2 :(得分:0)
嗯,首先你必须知道他们要给你的文件的编码。 “阿拉伯字符”可以描述您可能会遇到的单个字素,但是如果没有编码,它就像是训练猫或将指甲果冻到树上。 < / p>
运气好的话,他们给你你的一个Unicode编码(UTF-8,UCS-2等),“转换”将相对轻松。