我希望能够读取前几千字节的未知文件类型,看看它是否与任何已知的文件类型(即mp3文件,jpeg等等)相匹配。我正在考虑尝试从像PIL,sndhdr,py264等库中的文件加载元数据......看看他们是否选择了有效的格式,但我认为这一定是以前有人解决过的问题。
是否有一个库或一个要点显示了多个库的用法?
答案 0 :(得分:3)
使用python-magic
进行指纹识别。
库只能从字节数据中确定文件类型:
import magic
magic.from_buffer(start_data_from_something)
该库提供对libmagic
文件类型标识库的访问,该标识库还驱动UNIX file
命令。