选择多价楔形文字符号的数据结构

时间:2016-06-17 19:48:04

标签: database search data-structures

我正在为楔形文字标志开发一个搜索引擎,这个问题很复杂:

  • 每个标志可以有多个音节含义(复音)
  • 每个标志可以有多种标识含义(多价)
  • 每个音节意义都可以有多个符号(同音字)
  • 每个标志都有多个变体
  • 每个标志可以是其他标志的一部分

此外,每个标志都有几个与它们相关的数字(文献中的标准指数)。

哪种数据结构/数据库最适合存储这些条目?理想情况下,我希望能够搜索任何字段,并能够返回给用户一个有序列表,按相似性排序(我仍然在计算相似度函数)。在制作数据之后编辑数据不一定非常有效,因为这主要是静态资源。如果相关记录以某种方式连接,那么它也会很好,尽管不那么重要:符号AB是符号ABCD和ABMN的一部分,因此以某种方式与它们相关联。

标志的一个例子:

DA符号()具有音节含义:

  • TA
  • TA2
  • qab3
  • LE10

和逻辑意义:

  • le'u
  • tehu

组成部分标志FOO,BAR等。标志的MZL编号为561。

0 个答案:

没有答案