汉字编码(UTF-8,GBK)

时间:2015-01-14 15:32:39

标签: c# asp.net utf-8 globalization gbk

我有一个在不同网站上运行的网络抓取工具(本例中为中文)。

现在,当我检索数据并将其显示在我的网站上时,中文字符最终都是垃圾。好吧,我读到了字符编码,我发现UTF-8通常是最好的编码。

现在问题是当我使用UTF-8时 - 从WEBSITE-1抓取的数据显示正确但不适用于WEBSITE-2。

对于WEBSITE-2,字符编码gb18030正常工作。

我的问题是,有没有办法知道网站的字符编码,以便我可以构建一个通用的解决方案?我的意思是我可以在我的本地网站上呈现一个页面,知道要使用哪种字符编码。通过这种方式,我可以在后端进行编码,而不必担心前端打开页面需要什么编码。

现在我有两个页面,1个用于UTF-8中文字符,1个用于GB18030中文字符。

1 个答案:

答案 0 :(得分:0)

使用html元标记"内容类型"对于html< 5或元标记" char-set"对于html 5

W3schools charset