Question

我在PHP中使用cURL来获取网页内容并且它运行良好。但是我的程序现在要求我只从目标站点获取纯文本，而不是HTML。我已经广泛地看了这个，但没有人似乎有答案。我也尝试在我的cURL选项中设置CURLOPT_TRANSFERTEXT=1，但这似乎对结果没有影响。

知道为什么会这样吗？

Answer 1

确保您拥有以下内容：

curl_setopt($curl, CURLOPT_RETURNTRANSFER, true);

curl_exec的返回值应该是数据。

Answer 2

我认为这就是你要找的东西：

<?
$address = file_get_contents('http://www.thesite.com/file.html');
echo $address;



$file = file_get_contents('./file.txt', true);

 or 

$file = file_get_contents('./file.txt', FILE_USE_INCLUDE_PATH);

?>

Answer 3

其实我这样做是为了获取另一页的内容。

<?php
function curl_get_file_contents($URL)
    {
        $c = curl_init();
        curl_setopt($c, CURLOPT_RETURNTRANSFER, 1);
        curl_setopt($c, CURLOPT_URL, $URL);
        $contents = curl_exec($c);
        curl_close($c);

        if ($contents) return $contents;
            else return FALSE;
    }


echo curl_get_file_contents("http://www.php.net");
?>

但它将整个内容归还给我。

Answer 4

您的意思是要删除页面上的所有HTML标记吗？

只需使用strip_tags() function。

PHP cURL获得明文

4 个答案: