Erlang httpc:使用UTF-8编码的正文内容请求乱码响应

时间:2013-10-03 15:22:31

标签: http unicode character-encoding erlang

我在使用httpc:request从网站上获取正确编码的UTF-8内容时遇到一些问题。

我有这个功能:

fetch(Url) ->
    httpc:request(get, {Url, [{"User-Agent", ?USERAGENT}]}, [{autoredirect, false}], [{body_format, binary}]).

我称之为:

fetch("http://chateauvolterra.com").

如果您查看该网站,您会看到它已经声明了UTF-8的编码和一些像“Château”这样的unicode字符。不幸的是,当我收到回复时,扩展字符会出现乱码。

我尝试过以字符串和二进制格式获取body_format,但两者都有相同的问题。我也试过了ibrowse库,但似乎也有同样的问题。

是否存在某种系统范围的编码设置可能会让人烦恼?

如何在不破坏文档中的unicode字符的情况下从网上获取HTTP正文内容?

谢谢!

0 个答案:

没有答案