Question

我正在开发文档管理软件，并且我正在评估noSql数据库的存储和搜索数据。

总结当项目在目录和子目录中组织时，软件就像文件系统一样。

树的每个项目都可以有n个用于过滤和排序的属性。

项目最终也可以通过某种其他关系（父母除外）相互连接。

项目数量可能相对较大（数百万），应用程序的杀手级功能必须如此通过数据库增长来检索数据（使用过滤器和按属性排序）的恒定性能。

我需要3个关键功能：

获取文件夹的直接子项。对于每个文档属性，结果必须是可分页的，可排序的和可过滤的
获取文件夹的所有子项（子树的所有项）。对于每个文档属性，结果必须是可分页的，可排序的和可过滤的
获取文件夹的所有父母

我是noSql中的新手，实际上我使用的是rdbms（Sql Server），但我遇到了性能问题以及由文档属性的固定架构引起的所有限制。我正在评估OrangoDb或OrientDb，因为我认为它的功能（面向文档和面向图形）可能是满足我设计需求的最佳解决方案。

你能帮助我，给我一个关于设计数据库和查询这个3任务的建议吗？

的Nb。我需要查询的结果返回一个数据集，其中包含每个属性的列：

Es. doc1: p1: v1, p2: v2
    doc2: p1: v1, p3: v3

result:
    name | p1 | p2 | p3
    doc1   v1   v2   null
    doc2   v1   null v3

我认为将项目设计为：

{ 
  "_id": "_myItemId",
  "name`enter code here`" : "Item1",
  "itemType": "root / folder / file"   
  "parentItemId": "",
  "properties" : [ 
    { name: "Property1", formatType: 0, formatMask: "", value: "Value1" }, 
    { name: "Property2", formatType: 0, formatMask: "", value: "Value2" }, 
    { name: "Property3", formatType: 0, formatMask: "", value: "Value3" }  
  ] 
}

您对能够解决上述3个主要功能的设计有什么建议吗？

由于

Answer 1

图表数据库的方法与其他类型的dbms非常不同。你可以＆＃34;连接＆＃34;你的实体（Vertex）使用边缘，一个实体和另一个实体之间的直接链接。所以，首先，你不需要存储，例如。＆＃34; parentItemId＆＃34;对于每个对象，就像你在Sql或文档数据库中所做的那样，但是你将只有两个/三个或多个实体只有它们的特定数据;关系将由您在它们之间创建的边缘处理。

OrientdDb有一个非常好的文档和一些开始理解概念的例子。 EG：教程页面：http://orientdb.com/docs/2.1/Tutorial-Working-with-graphs.html解释了图形概念并有一些很好的例子。

在您的特定情况下，您可以有两种实体类型（顶点），文件夹和文档，以及您调用的边缘，例如。＆＃34; ChildOf＆＃34; （从文档到文件夹）或＆＃34;包含＆＃34; （从文件夹到文档）。然后，您可以执行许多查询来查找关系，甚至可以指定嵌套级别等。

您可以按以下步骤创建工作架构：

1创建类和边缘tpyes：

CREATE CLASS Document Extends V
CREATE CLASS Folder Extends V
CREATE CLASS ChildOf Extends E

2插入一些文件

INSERT INTO Document SET Title = 'Document 1', Name = '..'
INSERT INTO Document SET Title = 'Document 2', Name = '..'
INSERT INTO Document SET Title = 'Document 3', Name = '..'

3插入文件夹

INSERT INTO Folder SET Name = 'Folder 1'
INSERT INTO Folder SET Name = 'Folder 2'

4在顶点

之间创建边缘（关系）

CREATE EDGE ChildOf FROM #<specify document rid here> TO #<specify folder rid here>
...

您还可以通过设置相同的＆＃34; ChildOf＆＃34;来创建一个文件夹作为另一个文件夹的子文件夹。两个文件夹之间的边缘：

 CREATE EDGE ChildOf FROM #<specify children folder rid here> TO #<specify parent folder rid here>
...

5查询图表。使用expand（）和in（）运算符获取文件夹的直接子项：

Select expand(in('ChildOf')) From #<folder rid> Where ...

获取文件夹的所有子项，使用Traverse查询遍历起始文件夹中的所有子项：

SELECT FROM (
     TRAVERSE out('ChildOf') FROM #<folder rid> WHILE $depth <= 3 //you can specify the maximum level of nesting
) where $depth > 0 //exclude the first element (the starting folder itself)

使用遍历和＆＃34; In＆＃34;获取文件夹的所有父项。图形运算符：

SELECT FROM (
         TRAVERSE in('ChildOf') FROM #<folder rid> 
    ) where $depth > 0 //exclude the first element (the starting folder itself)
//here you could filter only the "Folders"
where @class ='Folder'

使用ArangoDb / OrientDb进行分层数据模型和文档搜索：是正确的解决方案吗？

1 个答案: