将django文件对象放入tikka服务器

时间:2017-03-06 09:28:29

标签: python django apache-tika

在我的项目中,我使用request.FILES.getlist('filedname')收到多个文件并使用django forms save方法保存。再次使用python的tika服务器api读取相同的文件:

def read_by_tika(self, path):
    '''file reading using tika server'''
    parsed = parser.from_file(str(path))
    contents = (parsed["content"].encode('utf-8'))
    return contents

有没有办法直接将列表文件从request.FILES发送到tikka服务器而不将其保存在硬盘上。

1 个答案:

答案 0 :(得分:1)

如果文件较小,请尝试将.from_buffer()file.read()一起使用。但是,django无论如何都会将超过2.5 MB的文件保存到临时文件中,请参阅Where uploaded data is stored。在这种情况下,请使用read_by_tika(file.temporary_file_path())。另请参阅file upload settings