我已经获得了大量的Xml,我需要提取部分文本元素并将其重用于其他目的。 (我正在使用XDocument来提取Xml数据)。
但是,如何解码元素中包含的文本?甚至这里使用的格式是什么?几个例子:
"What is the meaning of this® asks Sonny."
"The big centre cost 1¾ million pounds"
"... lost it. ® The next ..."
我试过HttpUtility.HtmlDecode
但是没有做到这一点。如果我解码两次“& reg;”变成了一个显然不对的®。
看起来像®是换行符。 & reg;可能是问号。 190一,我甚至都不知道。也许是点或逗号?
欢迎任何想法。
答案 0 :(得分:0)
您显示的字符串似乎已经过HTML编码,然后是XML编码(或再次使用HTML)。
正确®
- > ®
- >每the ISO Latin-1 entities - ®
®
(注册商标符号)的行为方式应该相同
同样地,¾
会变成代表四分之三的分数。