简单的Html Dom返回加密页面

时间:2016-11-19 13:49:46

标签: php curl web-scraping simple-html-dom

我正在尝试使用simple_html_dom和cUrl来抓取网页。 Butin导致它返回加密类型页面,(不可读的字符)。

使用Simple Html Dom

printf "%04x"

结果为This Encrypted Unreadable HTML

使用Curl

printf04x(){ typeset -Ui16 -Z7 x=$1; echo ${x: -4};}

func1()
{
    A=100
    echo "A - ${A} HEXA - $(printf04x $A)"
}

结果与上述相同:(此行为真的很奇怪,请帮忙。

1 个答案:

答案 0 :(得分:0)

实际上,加密内容是GZIPed内容。

通过使用内置PHP函数解码它来解决它

if ( ! function_exists('gzdecode'))
{

    function gzdecode($data) 
    {
        // strip header and footer and inflate

         return gzinflate(substr($data, 10, -8));
     }
 }

参考:Here is original post