我正在构建一个非常依赖EAV pattern来存储数据的网络应用。这基本上意味着对象的每个属性在海量数据库表中都有自己的行。我正在使用MySQL存储所有内容。这是我正在存储的一个非常简化的例子......
OBJECTS ATTRIBUTES
objId | type objId | attribute | value
============= =========================
1 | fruit 1 | color | green
2 | fruit 1 | shape | round
3 | book 2 | color | red
我知道有些人讨厌EAV,但我需要能够在不修改数据库架构的情况下随意添加新的对象属性,到目前为止它对我来说非常有用。
正如我想其他人在使用EAV数据结构构建系统时发现的,这种方法的缺点是多个对象与每个对象的属性一起被检索。目前我的应用程序一次只显示10个对象,所以我只查询我的EAV表10次(每个对象一次),它仍然非常快。但是,我想删除此限制并允许一次获取数百个对象。我还希望能够以比我目前更灵活的方式查询对象。
使用SQL连接执行此操作将是可怕的,因此我正在考虑缓存数据。平均而言,数据库每写1次就会获得大约300次读取,所以我认为这是缓存的一个很好的候选者。
到目前为止,这些是我提出的选择......
XML数据库列:每次执行写入操作时,都要更新 objects 表中包含所有对象属性的XML文本列。这可以快速读取数据,但是查询隐藏在数据库表中的XML数据很麻烦。
XML文件:每次执行写入操作时,都会将XML文件写入磁盘,其中包含每个对象及其属性。这样做的好处是我可以使用XQuery来查询对象。
NoSQL(例如MongoDB):也许我应该在像MongoDB这样的无模式数据库上构建系统。重写整个应用程序以使用MongoDB会非常耗时,但令我震惊的是我可以将它用作缓存。因此,例如,每次将数据写入EAV存储时,等效对象将在MongoDB中更新,然后将用于读取和查询。
最初我认为XML文件是最好的方法,但我可以看到文件变得非常庞大且难以管理。目前我倾向于使用MongoDB。我知道为一个应用程序运行两个数据库服务器似乎很疯狂,但我认为它可以在我的情况下工作。
我很想听听你对此的看法。
答案 0 :(得分:0)
我只看到两种方式,评论中都提到了这两种方式。
首先,您可以真正迁移到像Mongo这样的面向文档的数据库-适合作为EAV的替代。由于将不再需要JOIN和其他逻辑,因此它会非常快且略有扩展。 (因此,也许您可以避免使用缓存)。
第二,您可以使用Redis或Mongo或Memcached等特定的缓存工具来保存每个查询结果一段时间。
但是我想将目光转向这个系统的未来。计划的加载和缩放是什么? 如果要减少系统负载,我认为最好的方法是迁移到面向文档的数据库。 或者,如果您希望立即获得结果(缓存数据以供读取),则可以使用缓存工具,甚至在网络级别上也可以(例如,nginx支持开箱即用的memcached)。
因此,与往常一样,您应该在一次性费用和连续费用之间找到平衡。