从Xml解码字符串的问题

时间:2012-04-06 10:12:45

标签: c# .net xml html-encode

我已经获得了大量的Xml,我需要提取部分文本元素并将其重用于其他目的。 (我正在使用XDocument来提取Xml数据)。

但是,如何解码元素中包含的文本?甚至这里使用的格式是什么?几个例子:

"What is the meaning of this® asks Sonny."
"The big centre cost 1¾ million pounds"
"... lost it. ® The next ..."

我试过HttpUtility.HtmlDecode但是没有做到这一点。如果我解码两次“& reg;”变成了一个显然不对的®。

看起来像®是换行符。 & reg;可能是问号。 190一,我甚至都不知道。也许是点或逗号?

欢迎任何想法。

1 个答案:

答案 0 :(得分:0)

您显示的字符串似乎已经过HTML编码,然后是XML编码(或再次使用HTML)。

正确® - > ® - >每the ISO Latin-1 entities - ® ®(注册商标符号)的行为方式应该相同

同样地,&amp#190;会变成代表四分之三的分数。