Nokogiri如何提取抓取的HTML文档的Charset编码?

时间:2010-09-22 20:24:08

标签: ruby nokogiri

找到适用于HTML Simple Dom Parser的代码段。

$el=$html->find('meta[http-equiv=Content-Type]',0);
$fullvalue = $el->content;
preg_match('/charset=(.+)/', $fullvalue, $matches);
echo $matches[1];

有人可以帮我转换一下这样适合Ruby和Nokogiri吗?

1 个答案:

答案 0 :(得分:3)