我必须在mongodb中存储tiff(标记图像文件格式)或pdf扫描文件,该文件应该是文本搜索功能。就像我们想要“在文本的基础上”搜索它应该能够搜索。
我将使用.net mvc或java与mongodb。
那么如何存储这个pdf文件,然后才能从数据库中检索。
任何建议将不胜感激。
谢谢
答案 0 :(得分:4)
您可以使用this question中所述的MongoDb GridF存储文件,并使用this question中描述的某些功能从PDF文件中提取文本。 ;)
HTH
答案 1 :(得分:1)
我认为您应该将文件保存在服务器的文件系统上,文件的路径和MongoDB文件中的字符串, 从服务器文件系统读取文件然后从MongoDB加载它们会更有效。
另一种选择是将文件保存为二进制数据,但之后您将无法在文件内搜索。