引用文本和特殊字符的正则表达式

时间:2012-06-15 21:09:50

标签: c# .net xml regex

我试图找出一个.NET中的正则表达式,它可以检测用引号括起来的XML特殊字符。它们也可以包含其他字符,但必须至少存在以下一种情况< > & ' "

匹配

"Hello &"
"& Something"
"Testing <>"

不匹配

"foo bar"

我尝试过像"[&<>\"\'\w\s]+"这样的表达式,但这个正则表达式确实接受了特殊字符不存在的字符串。

此表达式的目的是清除可能导致解析器崩溃的特殊字符的所有XML属性。

1 个答案:

答案 0 :(得分:0)

你的正则表达式说任何这些字符的任何字符串(例如\w)都应匹配。试试这个:

    ^.*[&<>\"\'].*$
但是,你不应该逃避这些引用。

我希望您使用DOM解析器来检索属性值...