使用奇怪的希伯来语编码翻译数据文件

时间:2010-10-21 12:21:21

标签: encoding dos reverse-engineering file-format hebrew

我有一个二进制数据文件,采用相对古老的程序使用的格式,我试图将其转化为理智的东西。在Hex编辑器的帮助下,我基本上已经计算出文件格式,除了它包含带有奇数编码的希伯来字符。

所有字符均为8位。 “标准”27辅音(包括“最终”辅音)从十六进制80到9A。然后有些元音似乎是以十六进制9B左右开始的(我在标准辅音结束后猜测)。然后有“点缀”的辅音似乎从十六进制E0开始。

如果我没记错的话,我认为这是某种DOS编码。这是什么编码,我应该将其转换为什么编码,以便以色列的用户能够最轻松地在Microsoft Word中打开它?我可以使用任何工具进行翻译吗?

1 个答案:

答案 0 :(得分:1)

80到9A似乎匹配CP862中的代码点,但我找不到元音代码点的任何匹配项。我认为你应该做的只是制作一个自定义映射to Unicode并以UTF-8或UTF-16LE纯文本文件生成输出。如果您添加BOM(字节顺序标记),记事本和/或Word应该能够毫无问题地读取它。我可能会制作一个小的Python脚本,但任何其他语言都不应该这么做。