我有一系列存储在特定标记标准中的文件,这些文件在组合时构成了整个文本卷。该文本有许多不同的语言版本,并且这些文件中的每一个都是该语言的复制品。
为了通过Web应用程序存储,检索并向潜在的许多用户显示该信息,我需要实现最合适的方法。目前我正在思考:
将文件转换为XML(标记语言旨在使其变得容易),然后在用户想要查看该部分时加载相关文件。我使用Rails和Ember.js来显示结果,因此(我认为)要求数据采用JSON格式。
我的问题是:
我应该将XML转换为JSON并将其存储在文件中,还是每次请求时转换XML会更好? 我应该将数据存储在文件中还是应该将它们移动到数据库中? 鉴于文本的每个部分都可以有脚注和其他引用,如果我沿着数据库路线走下去,对于每种语言,将每个部分存储为表中的字段会更好吗?或者每种语言都应该拥有自己的表格?我是否应该进一步分解并为一个语言中的每个部分创建一个表格,然后有段落,脚注,引用等字段?
我正在回答关于实现它的最佳方法的答案,而不是能够实现它的实际方法。感谢。
答案 0 :(得分:0)
我使用eXist来存储XML文档,它对我来说效果很好。它是一个XML数据库,允许您存储XML文档并通过XPATH和XQUERY查询它们。还有一些Lucene集成用于基于文本的搜索。如果您正在考虑存储XML,您可能需要查看它。