我有一个文本,我从XML文件中提取。文本本身(存储在xml中)有许多分散在各处的html标签。我解析了这个文本并将其存储在一个数据库中,然后检索它并在屏幕上显示它。在大多数情况下,它工作正常。 HTML标签正确编码/解码,并按照我的预期渲染。
然而,有时,文本本身也包含奇数字符(想想带有重音符号,长破折号等的字母)。事实证明这些是有问题的,我无法弄清楚原因。当我单步执行代码时,它们具有适当的编码值,如果我使用HtmlEncode或HtmlDecode,它们会呈现正确的输出字符 - 但在我的浏览器中,它们看起来很糟糕。例如,我有一段文字应该说:
Dear Mrs. Budson —
最终呈现为
Dear Mrs. Budson —
当我查看数据库中存储的内容时,它存储为& #8199; (没有所有空格)。 HtmlDecode()将其解码为 - 但我的浏览器显示的内容完全不同。有什么想法吗?