在MongoDB中存储扫描的(pdf,tiff,jpeg)文件。

时间:2016-12-11 07:44:46

标签: mongodb mongodb-query mongodb-.net-driver spring-data-mongodb

我必须在mongodb中存储tiff(标记图像文件格式)或pdf扫描文件,该文件应该是文本搜索功能。就像我们想要“在文本的基础上”搜索它应该能够搜索。

我将使用.net mvc或java与mongodb。

那么如何存储这个pdf文件,然后才能从数据库中检索。

任何建议将不胜感激。

谢谢

2 个答案:

答案 0 :(得分:4)

您可以使用this question中所述的MongoDb GridF存储文件,并使用this question中描述的某些功能从PDF文件中提取文本。 ;)

HTH

答案 1 :(得分:1)

我认为您应该将文件保存在服务器的文件系统上,文件的路径和MongoDB文件中的字符串, 从服务器文件系统读取文件然后从MongoDB加载它们会更有效。

另一种选择是将文件保存为二进制数据,但之后您将无法在文件内搜索。