字典的数据结构

时间:2011-03-05 01:13:14

标签: java database data-structures text-extraction

我有.rtf格式的塞尔维亚语 - 英语单词,我需要从这个文档中提取它并将它们放入一些数据结构中。 我知道使用数据库,但我不知道它是否适合这种情况。例如,我有斜体字,不知道如何将其放入数据库(也许放在 标签内?)。是否有其他数据结构用于存储格式化文本(粗体和斜体)?

2 个答案:

答案 0 :(得分:1)

这取决于整个文本是否加下划线/斜体或只是某些部分。如果整个文本带有下划线/斜体,您可以在数据库表中添加两列,如“is_bold”和“is_italic”。否则我会建议某种标记(HTML标签或Markdown)。我专注于数据库解决方案,因为我假设你想要持久存储这个字典。

问候

西蒙

答案 1 :(得分:1)

这取决于db中所需的粒度。您能否根据格式的含义定义一致的数据模型?

class Entry {
    String serbianWord;
    String serbianPhonetic;
    String serbianOtherElementOfDictionary;
    String englishWord;
    String englishPhonetic;
    String englishOtherElementOfDictionary;
}

理想情况下,格式化(视图)和数据库(模型)应该分开。

但如果这样做会让问题变得过于复杂,那么存储标记数据是一个合理的选择。