以下是我的问题的背景。我正在浏览目录中的所有文件并对它们进行编码。大约80%的文件需要处理为UTF-8
,其余20%的文件需要处理为“ UTF-16”
我的解决方案是首先以UTF-8
打开文件,不兼容的文件将返回类似以下内容(仅供参考,它返回一个字符串):
'A\x00M\x00L\x001\x00 \x00M\x00F\x00G\x00 \x00O\x00n\x00e\x00-\x00P\x00o\x00i\x00n\x00t\x00 \x00L\x00e\x00s\x00s\x00o\x00n\x00:\x00\n\x00\n\x00\n\x00\n\x00E\x00x\x00p\x00o\x00s\x00e\x00d\x00 \x00b\x00e\x00a\x00r\x00d\x00 \x00i\x00n\x00 \x00t\x00h\x00e\x00 \x00M\x00a\x00n\x00u\x00f\x00a\x00c\x00t\x00u\x00r\x00i\x00n\x00g\x00 \x00a\x00r\x00e\x00a\x00s\x00\n\x00\n\x00\n\x00\n\x00A\x00r\x00e\x00a\x00 \x00I\x00m\x00p\x00a\x00c\x00t\x00e\x00d\x00:\x00 \x00A\x00M\x00L\x00-\x001\x00 \x00F\x00o\x00r\x00m\x00u\x00l\x00a\x00t\x00i
然后,我将浏览我的数据并找到导致上述格式的所有文件。这是我遇到问题的地方。我无法搜索\
,也无法搜索x00
。
这是最好的方法吗?如何过滤上述格式的文件。
任何帮助将不胜感激。