我试图找出一个.NET中的正则表达式,它可以检测用引号括起来的XML特殊字符。它们也可以包含其他字符,但必须至少存在以下一种情况< > & ' "
匹配
"Hello &"
"& Something"
"Testing <>"
不匹配
"foo bar"
我尝试过像"[&<>\"\'\w\s]+"
这样的表达式,但这个正则表达式确实接受了特殊字符不存在的字符串。
此表达式的目的是清除可能导致解析器崩溃的特殊字符的所有XML属性。
答案 0 :(得分:0)
你的正则表达式说任何这些字符的任何字符串(例如\w
)都应匹配。试试这个:
^.*[&<>\"\'].*$
但是,你不应该逃避这些引用。
我希望您使用DOM解析器来检索属性值...