应用错误收集

Nokogiri如何提取抓取的HTML文档的Charset编码？

时间：2010-09-22 20:24:08

标签： ruby nokogiri

找到适用于HTML Simple Dom Parser的代码段。

$el=$html->find('meta[http-equiv=Content-Type]',0);
$fullvalue = $el->content;
preg_match('/charset=(.+)/', $fullvalue, $matches);
echo $matches[1];

有人可以帮我转换一下这样适合Ruby和Nokogiri吗？

1 个答案:

答案 0 :(得分：3)

meta_encoding()