检查文件是否包含多字节字符

时间:2012-04-29 15:14:08

标签: linux multibyte

我有一些UTF-8的字幕文件。有时在这些文件中存在一些偶发的多字节字符,这在某些应用程序中会导致问题。

如果某个文件包含任何多字节字符,我如何检查linux(并且可能找到这些)。

2 个答案:

答案 0 :(得分:2)

您可以使用filechardet命令。

答案 1 :(得分:2)

您可以使用文件命令

chalet16$ echo test > a.txt
chalet16$ echo testก >  b.txt #One of Thai characters
chalet16$ file *.txt
a.txt: ASCII text
b.txt: UTF-8 Unicode text