Question

我已经获得了大量的Xml，我需要提取部分文本元素并将其重用于其他目的。（我正在使用XDocument来提取Xml数据）。

但是，如何解码元素中包含的文本？甚至这里使用的格式是什么？几个例子：

"What is the meaning of this&amp;reg; asks Sonny."
"The big centre cost 1&amp;#190; million pounds"
"... lost it. &amp;#174; The next ..."

我试过HttpUtility.HtmlDecode但是没有做到这一点。如果我解码两次“＆amp; reg;”变成了一个显然不对的®。

看起来像＆amp;＃174;是换行符。＆amp; reg;可能是问号。 190一，我甚至都不知道。也许是点或逗号？

欢迎任何想法。

Answer 1

您显示的字符串似乎已经过HTML编码，然后是XML编码（或再次使用HTML）。

正确&reg; - ＆gt; ® - ＆gt;每the ISO Latin-1 entities - ® &#174;（注册商标符号）的行为方式应该相同

同样地，&amp#190;会变成代表四分之三的分数。