“按订单搜索”的数据结构

时间:2010-02-07 03:23:27

标签: sql data-structures data-storage

我想知道我应该为这个问题使用什么数据结构/存储策略。

数据库中的每个数据条目都包含多个有序项目的列表,例如A-B-C-D,其中A,B,C,D是不同的项目。

假设我在数据库中有3个条目,

A-B-C-d

E-F-G

G-H-B-A

当用户输入一些无序项时,我必须从数据库中找到匹配的有序条目。例如,如果用户输入A,B,G,H,我想将G-H-B-A从数据库返回给用户。

我的数据存储策略应该是什么?

2 个答案:

答案 0 :(得分:1)

将列表拆分为单个项目并在该级别上工作。

一些表格:

列表

  • ID(PK)
  • 序列(上面的“A-B-C-D”条目)
  • [无论如何]

  • ID(PK)
  • 名称(价值,单词,无论有意义)
  • [无论如何]

list_items

  • LIST_ID
  • ITEM_ID
  • [序数int,如果“G-H-B-A”和“A-B-G-H”被认为是不同的序列]

(复合PK list_ID,item_ID [,ordinal]就那个,基本多:很多关系)

一些数据,因此表格更清楚:

INSERT INTO items (ID, name) VALUES (1, 'A'), (2, 'B'), (3, 'G'), (4, 'H');
INSERT INTO lists (ID, sequence) VALUES (1, 'A-B-G-H');
INSERT INTO list_items (list_ID, item_ID) VALUES (1, 1), (1, 2), (1, 3), (1, 4);
INSERT INTO lists (ID, sequence) VALUES (2, 'B-A-G');
INSERT INTO list_items (list_ID, item_ID) VALUES (2, 2), (2, 1), (2, 3);

最后,找到包含所有项目(A,B,G,H)的列表:

SELECT lists.sequence FROM lists
JOIN list_items ON lists.ID = list_items.list_ID
JOIN items AS i1 ON list_items.item_ID = i1.ID HAVING i1.name = 'A'
JOIN items AS i2 ON list_items.item_ID = i2.ID HAVING i2.name = 'B'
JOIN items AS i3 ON list_items.item_ID = i3.ID HAVING i3.name = 'G'
JOIN items AS i4 ON list_items.item_ID = i4.ID HAVING i4.name = 'H'

应返回任何列表,如“A-B-G-H”,“G-H-A-B”,“H-A-T-B-A-G”等,但不返回“B-U-G-H-U-T”(无A)或“B-A-T-H”(无G) - 必须满足所有条件。进行“任何”搜索可能会涉及更多(在午餐时写这篇文章,但单独RIGHT JOIN可能会导致各种重复和缓慢)。

它不会映射任何基因组或重新定义人类语言,但对于体面大小的数据集应该没问题。无论哪种方式,我都避免将每个列表存储为varchar并执行“WHERE sequence LIKE '%A%' AND sequence LIKE '%B%'”内容,除非您绝对无法处理添加新数据的额外工作。

答案 1 :(得分:1)

您最好分别存储有序和无序元素,否则您需要搜索有序元素的所有排列,这将非常耗时。

试试这个:

/* Create a table to track your items (A, B, C, etc.). It contains all possible elements */
CREATE TABLE [Items](
    [Value] [char](1) NOT NULL,
 CONSTRAINT [PK_Items] PRIMARY KEY CLUSTERED ([Value]))

/* Create a table to track their grouping and stated ordering */
CREATE TABLE [Groups](
    [ID] [int] NOT NULL,
    [Order] [text] NOT NULL,
 CONSTRAINT [PK_Groups] PRIMARY KEY CLUSTERED ([ID]))

/* Create a mapping table to associate them */
CREATE TABLE [ItemsToGroups](
    [Item] [char](1) NOT NULL,
    [Group] [int] NOT NULL
)

ALTER TABLE [ItemsToGroups]  WITH CHECK ADD CONSTRAINT [FK_ItemsToGroups_Groups] FOREIGN KEY([Group])
REFERENCES [Groups] ([ID])

ALTER TABLE [ItemsToGroups] CHECK CONSTRAINT [FK_ItemsToGroups_Groups]

ALTER TABLE [ItemsToGroups]  WITH CHECK ADD CONSTRAINT [FK_ItemsToGroups_Items] FOREIGN KEY([Item])
REFERENCES [Items] ([Value])

ALTER TABLE [ItemsToGroups] CHECK CONSTRAINT [FK_ItemsToGroups_Items]

/* Populate your tables. 
   Items should have eight rows: A, B, C,...H
   Groups should have three rows: 1:ABCD, 2:EFG, 3:GHBA
   Items to groups should have eleven rows: A:1, B:1,...A:3 */

/* You will want to pass in a table of values, so set up a table-valued parameter
   First, create a type to support your input list */
CREATE TYPE ItemList AS TABLE (e char(1) NOT NULL PRIMARY KEY)
DECLARE @Input ItemList
GO

/* Create a stored procedure for your query */
CREATE PROCEDURE SelectOrderedGroup @Input ItemList READONLY AS
    SELECT *
    FROM Groups
    WHERE Groups.ID NOT IN (
        SELECT [Group]
        FROM ItemsToGroups
        WHERE Item NOT IN (SELECT e FROM @Input)
    )
GO

/* Now when you want to query them: */
DECLARE @MyList ItemList
INSERT @MyList(e) VALUES('G'),('H'),('B'),('A')
EXEC SelectOrderedGroup @MyList

以上将返回3:GHBA,就像你想要的那样。如果你传入DCBA,你会得到1:ABCD,再次就像你正在寻找的那样。如果你传入C,你什么都不会回来,因为没有一个团体只有C.

您可能希望使用table-valued parameter作为输入,如上所示,但您可以将最终的SELECT转换为简单列表并删除ItemList类型。