我有一些UTF-8的字幕文件。有时在这些文件中存在一些偶发的多字节字符,这在某些应用程序中会导致问题。
如果某个文件包含任何多字节字符,我如何检查linux(并且可能找到这些)。
答案 0 :(得分:2)
您可以使用file
或chardet
命令。
答案 1 :(得分:2)
您可以使用文件命令
chalet16$ echo test > a.txt
chalet16$ echo testก > b.txt #One of Thai characters
chalet16$ file *.txt
a.txt: ASCII text
b.txt: UTF-8 Unicode text