我从德语网页获取HTML,我必须将其html插入数据库,但是当我将其插入数据库时,德语字母并不会显得那么co。
例如。 Bundesstraße
显示为Bundesstraße
。我正在使用C#和MYsql数据库。
答案 0 :(得分:3)
似乎特殊字符在网站上被编码为html实体(http://www.w3schools.com/tags/ref_entities.asp)。当使用UTF8时,这不是必需的,但许多站点仍然这样做。
如果您想拥有网站上的确切html,这些编码实体是正确的。
要解码实体,您可以使用System.Net.WebUtility.HtmlDecode(yourString)
。
答案 1 :(得分:1)
您使用的是哪种编码?
尝试切换到UTF-8并确保您的数据库支持它。看起来好像你的字符串正在使用HTML编码,这对于演示文稿很好,但是你需要原始格式才能将它存储在数据库中。
答案 2 :(得分:0)
在HTML中,ß
编码为ß
。
你说“我必须在数据库中插入html”,你现在得到的是正确的。