如何使用正则表达式在xml文件中获取两个或多个匹配标记

时间:2016-03-17 05:56:54

标签: regex xml

我在下面的xml代码中需要有关正则表达式的帮助我想一次提取两个标签(标题,价格)中的值,以便我的输出看起来像

需要输出:

  <title lang="en">Everyday Italian</title>
  <price>30.00</price>
  <title lang="en">XQuery Kick Start</title>
  <price>29.99</price>
  <title lang="en">XQuery Kick Start</title>
  <price>49.99</price>
  <title lang="en">Learning XML</title>
  <price>39.95</price>

现在我正在使用:

   ^\s*<title>.*</title>

此代码仅提取<title>

  <title lang="en">Everyday Italian</title>
  <title lang="en">XQuery Kick Start</title>
  <title lang="en">XQuery Kick Start</title>
  <title lang="en">Learning XML</title>

如何一次获得两个标签?可以有人帮助我

XML:

    <?xml version="1.0" encoding="UTF-8"?>
    <bookstore>
    <book category="COOKING">
      <title lang="en">Everyday Italian</title>
      <author>Giada De Laurentiis</author>
      <year>2005</year>
      <price>30.00</price>
    </book>
    <book category="CHILDREN">
     <title lang="en">Harry Potter</title>
     <author>J K. Rowling</author>
     <year>2005</year>
     <price>29.99</price>
    </book>
    <book category="WEB">
      <title lang="en">XQuery Kick Start</title>
      <author>James McGovern</author>
      <author>Per Bothner</author>
      <author>Kurt Cagle</author>
      <author>James Linn</author>
      <author>Vaidyanathan Nagarajan</author>
      <year>2003</year>
      <price>49.99</price>
    </book>
<book category="WEB">
   <title lang="en">Learning XML</title>
   <author>Erik T. Ray</author>
   <year>2003</year>
   <price>39.95</price>
</book>
</bookstore> 

2 个答案:

答案 0 :(得分:0)

您的正则表达式与您给定的xml不匹配,因为您尚未处理 <style name="DialogCustomTheme" parent="android:Theme.Holo.Dialog.NoActionBar"> <item name="android:windowBackground">@color/transparent</item> <item name="android:colorBackgroundCacheHint">@null</item> 标记的属性。您可以使用此正则表达式使用单个表达式获取titletitle个标记:

price

regex matching price tag example
same regex matching title tag example

此外,您可以使用反向引用\ 1和\ 2获取标记名称和值到捕获的组。

答案 1 :(得分:0)

你的环境是什么?您可以使用类似于unix的命令行上的grep轻松完成此操作:

grep -E "<(title|price)"