如何返回属于同一级别的子类别的类别?

时间:2015-10-21 22:43:38

标签: xml xpath hierarchical-data xpath-1.0

如何使用XPath(最好是1.0)选择具有子类别值的类别列表?

结构如下:

  • 类别(1)
    • name(1)
    • value(1-1)
    • value(1-2)
  • 类别(2)
    • name(2)
    • 值(2-1)
    • value(2-2)
    • value(2-3)

理想情况下,我需要一个类别名称及其相关值的返回列表,例如:

  • name(1):value(1-1),value(1-2)
  • name(2):value(2-1),value(2-2),value(2-3)

或理想情况:

  • name(1)/ value(1-1)
  • name(1)/ value(1-2)
  • name(2)/ value(2-1)
  • name(2)/ value(2-2)
  • name(2)/ value(2-3)

    我希望/characteristics/category/[concat(name/uk, "/", value/uk)] - 就像,但语法不正确,

或任何类似的格式,因为我可以将主要类别与子类别区分开来,因此我可以使用适当的后端语言进一步解析该数据。

基本上我希望实现类别及其子类别之间的关联,以便将它们存储在分层分类词汇表中。

我从Feed中获得了以下XML:

<characteristics>
  <category id="1">
    <name>
      <uk>Orientation</uk>
      <es>Orientación</es>
    </name>
    <value id="1">
      <uk>North</uk>
      <es>Norte</es>
    </value>
    <value id="2">
      <uk>East</uk>
      <es>Este</es>
    </value>
    <value id="3">
      <uk>South</uk>
      <es>Sur</es>
    </value>
    <value id="4">
      <uk>West</uk>
      <es>Oeste</es>
    </value>
  </category>
  <category id="2">
    <name>
      <uk>Condition</uk>
      <es>Estado</es>
    </name>
    <value id="1">
      <uk>Recently Refurbished</uk>
      <es>Renovado Recientemente</es>
    </value>
  </category>
  <category id="3">
    <name>
      <uk>Pool</uk>
      <es>Piscina</es>
    </name>
    <value id="1">
      <uk>Private</uk>
      <es>Privada</es>
    </value>
  </category>
  <category id="4">
    <name>
      <uk>Climate Control</uk>
      <es>Climatización</es>
    </name>
    <value id="1">
      <uk>Fireplace</uk>
      <es>Chimenea</es>
    </value>
  </category>
  <category id="5">
    <name>
      <uk>Views</uk>
      <es>Vistas</es>
    </name>
    <value id="1">
      <uk>Sea</uk>
      <es>Mar</es>
    </value>
    <value id="2">
      <uk>Mountain</uk>
      <es>Montaña</es>
    </value>
    <value id="3">
      <uk>Panoramic</uk>
      <es>Panorámicas</es>
    </value>
  </category>
  <category id="6">
    <name>
      <uk>Features</uk>
      <es>Caracteristicas</es>
    </name>
    <value id="1">
      <uk>Guest Apartment</uk>
      <es>Aprtmnt. Huéspedes</es>
    </value>
    <value id="2">
      <uk>Guest House</uk>
      <es>Casa de Huéspedes</es>
    </value>
    <value id="3">
      <uk>Barbeque</uk>
      <es>Barbacoa</es>
    </value>
  </category>
</characteristics>

这是XPath查询,它返回第一个类别的值:

/characteristics/category[@id=1]/name/uk | /characteristics/category[@id=1]/value/uk
<uk>Orientation</uk>
<uk>North</uk>
<uk>East</uk>
<uk>South</uk>
<uk>West</uk>

现在我如何组合,比较或反向引用这两个id并让它动态地适用于每个类别?

知道如何生成这样的XPath查询吗?

我还尝试了../..parent::ancestor::[]的不同组合,如表达式和条件,但没有成功。我也尝试使用string-join,但它不适用于此demo,其次是我正在尝试解析它的代码doesn't support XPath 2.0。

或者是最接近/相似的选择/格式,它允许我列出和区分不同类别的名称及其相关值,所以我可以用不同的语言进一步解析该结构?

其他尝试:

  • concat(/characteristics/category[@id=@id]/name/uk, "/", /characteristics/category[@id=@id]/value/uk)

    仅返回第一个元素:Orientation/North(不需要[@id=@id]

  • concat(/characteristics/category/*/*[name()="uk"]/node(), /characteristics/category)

    创建了一些我不理解的层次结构(它是什么样的格式):

    Orientation
          Orientation
          Orientación
    
          North
          Norte
    
          East
          Este
    
          South
          Sur
    
          West
          Oeste
    

    但仅适用于第一个主要类别

2 个答案:

答案 0 :(得分:2)

XPath用于选择,而不是操纵。您可以选择输入XML文档中显示的节点;你无法任意重新安排这些节点,尤其是XPath 1.0。如果要重新排列节点,请使用XSLT或您调用XPath库的其他语言。

更新:即使在您的评论和问题更新之后,您仍然坚持认为XPath 1.0评估的结果不仅仅是从输入XML文档中选择的节点列表 。想要一个层次结构而不是一个列表表明你期望过多的XPath 1.0。

最终更新......

XPath 2.0解决方案

根据您的输入XML,此XPath 2.0表达式:

for $c in //category 
    return for $v in $c/value 
               return concat($c/name/uk, ' / ', $v/uk)

将产生

Orientation / North
Orientation / East
Orientation / South
Orientation / West
Condition / Recently Refurbished
Pool / Private
Climate Control / Fireplace
Views / Sea
Views / Mountain
Views / Panoramic
Features / Guest Apartment
Features / Guest House
Features / Barbeque
根据要求

答案 1 :(得分:0)

最接近的XPath 1.0查询将是:

characteristics/category/*/*[name()="uk"]/text()

将返回项目的平面列表:

Orientation
North
East
South
West
Condition
Recently Refurbished
...

它将以正确的顺序(主要和子类别)返回所有项目,但没有任何层次结构。

缺点是需要在其他地方检测和管理层次结构。例如,在Drupal CMS中我将这样的XML提要导入 Taxonomy术语,因此在我手动排列项目的层次结构后,使用现有名称的下一次导入将保持这种层次结构。