如何在Bash中获取字符的unicode代码点或字节值?

时间:2017-02-15 19:18:09

标签: bash character-encoding unicode-normalization

我有两个文件的diff输出,每行一个字符。有时输出字符在"不同"在我的终端看起来一样的线条。我想通过一个函数来管道diff输出,该函数可以将字节值(甚至可能是unicode代码点)添加到输出中,这样我就可以看到实际的字节差异了。

我无法弄清楚如何在Bash中获取字符的字节值。有没有办法做到这一点?我看到了关于走另一个方向的各种答案,但我想从字符到字节值。

2 个答案:

答案 0 :(得分:2)

您可以使用od -t a来显示各种字符表示形式,包括命名ASCII(od -t x1)或十六进制(with)。

答案 1 :(得分:2)

您可以使用vimdiff在vim中显示并排差异,然后使用 ga 显示代码点,并使用 g8 来显示utf-8字节。