在python中指纹识别数据字符串的文件类型

时间:2013-05-07 12:11:16

标签: python python-imaging-library fingerprinting

我希望能够读取前几千字节的未知文件类型,看看它是否与任何已知的文件类型(即mp3文件,jpeg等等)相匹配。我正在考虑尝试从像PIL,sndhdr,py264等库中的文件加载元数据......看看他们是否选择了有效的格式,但我认为这一定是以前有人解决过的问题。

是否有一个库或一个要点显示了多个库的用法?

1 个答案:

答案 0 :(得分:3)

使用python-magic进行指纹识别。

库只能从字节数据中确定文件类型:

import magic
magic.from_buffer(start_data_from_something)

该库提供对libmagic文件类型标识库的访问,该标识库还驱动UNIX file命令。