存储,检索和显示大量文本

时间:2012-06-08 15:52:22

标签: xml database ruby-on-rails-3 json text

我有一系列存储在特定标记标准中的文件,这些文件在组合时构成了整个文本卷。该文本有许多不同的语言版本,并且这些文件中的每一个都是该语言的复制品。

为了通过Web应用程序存储,检索并向潜在的许多用户显示该信息,我需要实现最合适的方法。目前我正在思考:

将文件转换为XML(标记语言旨在使其变得容易),然后在用户想要查看该部分时加载相关文件。我使用Rails和Ember.js来显示结果,因此(我认为)要求数据采用JSON格式。

我的问题是:

我应该将XML转换为JSON并将其存储在文件中,还是每次请求时转换XML会更好? 我应该将数据存储在文件中还是应该将它们移动到数据库中? 鉴于文本的每个部分都可以有脚注和其他引用,如果我沿着数据库路线走下去,对于每种语言,将每个部分存储为表中的字段会更好吗?或者每种语言都应该拥有自己的表格?我是否应该进一步分解并为一个语言中的每个部分创建一个表格,然后有段落,脚注,引用等字段?

我正在回答关于实现它的最佳方法的答案,而不是能够实现它的实际方法。感谢。

1 个答案:

答案 0 :(得分:0)

我使用eXist来存储XML文档,它对我来说效果很好。它是一个XML数据库,允许您存储XML文档并通过XPATH和XQUERY查询它们。还有一些Lucene集成用于基于文本的搜索。如果您正在考虑存储XML,您可能需要查看它。