我正在为楔形文字标志开发一个搜索引擎,这个问题很复杂:
此外,每个标志都有几个与它们相关的数字(文献中的标准指数)。
哪种数据结构/数据库最适合存储这些条目?理想情况下,我希望能够搜索任何字段,并能够返回给用户一个有序列表,按相似性排序(我仍然在计算相似度函数)。在制作数据之后编辑数据不一定非常有效,因为这主要是静态资源。如果相关记录以某种方式连接,那么它也会很好,尽管不那么重要:符号AB是符号ABCD和ABMN的一部分,因此以某种方式与它们相关联。
标志的一个例子:
DA符号()具有音节含义:
和逻辑意义:
组成部分标志FOO,BAR等。标志的MZL编号为561。