Question

我在屏幕上抓一个丹麦语的网站..我无法像某些人那样刮掉某些字符。有什么想法解决这个问题？感谢

Answer 1

尝试使用UTF-8或Windows-1252字符集。

Answer 2

如果您使用的是Web浏览器控件，则可以将页面编码设置为可以显示该字符的任何语言。然后只提取页面源。

Answer 3

我刚使用了System.Web.HttpContext.Current.Server.HtmlDecode（）它有效..

Answer 4

我使用iso-8859-1进行解码。 HTH

Answer 5

最好使用与HttpWebResponse对象相同的编码，以下是适用于所有语言和字符的代码。

        response = (HttpWebResponse)request.GetResponse();
        string Charset = response.CharacterSet;

        Encoding encoding = Encoding.GetEncoding(Charset);

        if (response.StatusCode == HttpStatusCode.OK)
        {
            response_stream = new StreamReader(response.GetResponseStream(), encoding);

            html = response_stream.ReadToEnd();
        }

屏幕抓取

5 个答案: