我正在尝试使用simple_html_dom和cUrl来抓取网页。 Butin导致它返回加密类型页面,(不可读的字符)。
使用Simple Html Dom
printf "%04x"
结果为This Encrypted Unreadable HTML
使用Curl
printf04x(){ typeset -Ui16 -Z7 x=$1; echo ${x: -4};}
func1()
{
A=100
echo "A - ${A} HEXA - $(printf04x $A)"
}
结果与上述相同:(此行为真的很奇怪,请帮忙。
答案 0 :(得分:0)
实际上,加密内容是GZIPed内容。
通过使用内置PHP函数解码它来解决它
if ( ! function_exists('gzdecode'))
{
function gzdecode($data)
{
// strip header and footer and inflate
return gzinflate(substr($data, 10, -8));
}
}