注册以下数据

时间:2012-06-05 07:14:12

标签: regex solr

我有一个像这样的XML数据字段

<some info></some info><Some info2></some info2><description><lot of info></description><some more info></some more info><description><info></description>

我想要一个正在删除的正则表达式  <description>anything</description> 对于所有“描述”标签。 (可能有任意数量)

我必须把它作为Solr架构中的字符模式过滤器。

1 个答案:

答案 0 :(得分:2)

你可能会得到一些会告诉你的人:

  1. 您无法使用RegEx解析XML。
  2. 您应该使用DOM库。
  3. 但是,如果你要做的就是删除<description>代码之间的内容,它应该像搜索<description>.*?</description>一样简单,并且不需要替换。