应用错误收集

时间：2014-11-05 20:52:32

标签： mongodb hadoop mahout nosql

我希望在mongodb数据库中存储文本和图像的混合数据。我后面的工作将是从混合数据集中分别识别文本和图像。我该怎么做上面提到的步骤？是适合mongodb还是我应该尝试hadoop或mahout？

请建议。

答案 0 :(得分：0)

StackOverflow在这里回答了类似的问题：https://stackoverflow.com/a/4800186/3993224

此外，MongoDB提供了有关存储大型文件（如图像）的信息：http://docs.mongodb.org/manual/core/gridfs/

我认为存储图像的方式是作为文档的键/值对或文档中的嵌入文档。理想情况下，您希望将与图像关联的文本存储在同一文档中的另一个键/值对中，以便将图像和文本放在一起。

答案 1 :(得分：0)

您的链接对数据存储非常有帮助。

我的计划是存储数据，但没有标记有助于以后单独识别文本或图像。我需要仅通过读取二进制内容而不是通过读取嵌入数据的任何信息来单独识别文本和图像。

N.B。文本和图像都是二进制格式。