我正在制作抓取应用。我想解析一些角色。 但有些页面不是UTF-8字符集。
我有页面正文,现在我想用正文字符串做一些工作。 首先,如果页面编码不是UTF-8,我应该将编码转换为UTF-8。
我该怎么办?
答案 0 :(得分:2)
您可以使用Erlang iconv library进行此类转换。这很简单!
iconv
{:iconv, "~> 1.0.0"}
添加到deps,将:iconv
添加到mix.exs
:iconv.convert("euc-kr", "utf-8", "input")
您可以在命令行中找到list of supported encodings on the libiconv page或运行iconv --list
。