使用wget更改文本编码下载文件

时间:2013-03-30 18:56:05

标签: character-encoding wget

我想要的网页有windows-1251字符集编码。 有没有办法不只是简单地下载这个页面,而是自动..嗯..将文本内部转换为uft-8?

我尝试将其他参数添加到wget,如

--header='Accept-Charset: utf-8'

但没有运气。

1 个答案:

答案 0 :(得分:3)

您可以使用

iconv -f ISO-8859-1 -t UTF-8 ./index.html > ./utf.html

转换编码。见https://wiki.archlinux.org/index.php/Convert_a_text_file%27s_encoding