我想要的网页有windows-1251字符集编码。 有没有办法不只是简单地下载这个页面,而是自动..嗯..将文本内部转换为uft-8?
我尝试将其他参数添加到wget,如
--header='Accept-Charset: utf-8'
但没有运气。
答案 0 :(得分:3)
您可以使用
iconv -f ISO-8859-1 -t UTF-8 ./index.html > ./utf.html
转换编码。见https://wiki.archlinux.org/index.php/Convert_a_text_file%27s_encoding