我想根据python中的扩展名对文件类型进行分类。在自己编写之前我想检查是否有任何可以用于此目的的python包。按文件类型我的意思是将其归类为例如。 Doc,ppt,pdf,tar,txt,iso等理想情况下它会将文件名作为输入并返回其类型。我正在linux上运行
答案 0 :(得分:2)
您应该查看文档元数据解析器。我在我的一些项目中使用了Apache Tika这是一个java库。您可以查看此问题Python-based document metadata parser?以了解如何在Python中使用它
答案 1 :(得分:1)
在Linux中,您可以使用'file'utillity来确定文件类型。所以,如果你想要,你也可以在你的脚本中使用它:
import subprocess
subprocess.call(['file', 'yourfile'])