我有一大堆具有不同模式的XML文件。许多文件共享相同的模式,但我不知道存在多少类型。如何确定(1)模式的数量和(2)每个文件的模式?理想情况下,输出将允许我连接类型1的所有文件,类型2的所有文件等。
答案 0 :(得分:0)
您对“架构”的含义有一个混淆的理解。模式是模式组件的集合(例如类型,元素声明等),并且给定一组1000种类型,你有多少不同模式的问题是没有意义的 - 我想答案是某种组合函数,它考虑了所有可能的1000个子集。
更有意义的问题可能是您的实例中有多少个不同的顶级元素。即使没有任何架构信息,您也可以确定:它只是
count(distinct-values(collecion("XYZ")/node-name(*)))