德语字母编码问题

时间:2011-07-30 18:50:17

标签: c# encoding character-encoding

我从德语网页获取HTML,我必须将其html插入数据库,但是当我将其插入数据库时​​,德语字母并不会显得那么co。 例如。 Bundesstraße显示为Bundesstraße。我正在使用C#和MYsql数据库。

3 个答案:

答案 0 :(得分:3)

似乎特殊字符在网站上被编码为html实体(http://www.w3schools.com/tags/ref_entities.asp)。当使用UTF8时,这不是必需的,但许多站点仍然这样做。

如果您想拥有网站上的确切html,这些编码实体是正确的。 要解码实体,您可以使用System.Net.WebUtility.HtmlDecode(yourString)

答案 1 :(得分:1)

您使用的是哪种编码?

尝试切换到UTF-8并确保您的数据库支持它。看起来好像你的字符串正在使用HTML编码,这对于演示文稿很好,但是你需要原始格式才能将它存储在数据库中。

答案 2 :(得分:0)

在HTML中,ß编码为ß

你说“我必须在数据库中插入html”,你现在得到的是正确的。