可以有效地使用XML从数据创建架构以进行解析吗?

时间:2019-04-22 12:31:45

标签: c parsing data-structures xml-parsing

请注意,尽管时间允许,我目前仍会使用C语言进行编程。

通常,我会得到一个文本/行编码信息数据库,该数据库太大而无法手工建模。可能有数百万行,因此无法全部查看并了解其结构。

我开始做的是先通过预处理,然后开始使用XML标记分解结构。举一个简化的例子,如果您正在看一所学校的入学学生,您可能会注意到一个变化,该变化描述了“成绩”组,而一个描述了“班级”。

我开始尝试做的是将数据转换为XML,然后使用工具创建模式并进行查看。接下来的事情是找到可用于进一步开发数据结构模型的子模式,而使用正则表达式搜索可以很容易地实现这种模式。

我遇到了问题;模式生成器可以区分CLASS,因为它在一个环境中仅看到11年级的学生,而在另一新生中。然后,如果实际上它们在功能上是相同的,就好像有一些独特的变体一样,使CLASS破裂。这会大大增加模型的复杂性。

在任何数据流中,几种类型的数据都是常见的。结构/组织,引用,标记/编码和原始内容。

当对数据进行建模并且可以保证符合模式时,我可以流对其进行解析(也许带有堆栈?),也可以通过针对每个数据结构调用的函数对其进行解析。当数据不是按线性顺序排序时,流解析就会受到影响。功能解析可能是目标,但我还没有使用太多,因为我无法整理结构。

问题:您建议对方法进行哪些改进,或者您认为哪种方法更好?

0 个答案:

没有答案