我有这个示例字符串:
≪! [If Gte Mso 9]>≪Xml> ≪Br /> ≪O:Office Document Settings> ≪Br /> ≪O:Allow Png/> ≪Br /> ≪/O:Off...
我想特别针对以“«”开头并以“>”结尾的任何内容,并将其替换为无空格“”。
一直在使用Rubular,但是我正在学习如何设置这个问题。
任何idaes?
答案 0 :(得分:2)
result = subject.gsub(/≪[^>]*>/, '')
应该这样做。
[^>]*
表示:匹配除>
以外的任意数量的字符。
答案 1 :(得分:2)
模式很简单:
≪[^>]*>
答案 2 :(得分:0)
只是一个有用的提示,我使用Rubular来帮助正则表达式编写调试。
答案 3 :(得分:0)
看起来你确实试图用正则表达式解析XML,这是从该文档中提取所需数据的一种非常困难和脆弱的方法。
您可能最好解析它并使用XPath或DOM选择所需的信息。