Question

我有这个示例字符串：

&Lt;! [If Gte Mso 9]>&Lt;Xml>  &Lt;Br /> &Lt;O:Office Document Settings>  &Lt;Br /> &Lt;O:Allow Png/>  &Lt;Br /> &Lt;/O:Off...

我想特别针对以“«”开头并以“＆gt;”结尾的任何内容，并将其替换为无空格“”。

一直在使用Rubular，但是我正在学习如何设置这个问题。

任何idaes？

Answer 1

result = subject.gsub(/&Lt;[^>]*>/, '')

应该这样做。

[^>]*表示：匹配除>以外的任意数量的字符。

Answer 2

模式很简单：

&Lt;[^>]*>

Answer 3

只是一个有用的提示，我使用Rubular来帮助正则表达式编写调试。

Answer 4

看起来你确实试图用正则表达式解析XML，这是从该文档中提取所需数据的一种非常困难和脆弱的方法。

您可能最好解析它并使用XPath或DOM选择所需的信息。