使用php抓取页面正文并将抓取的字符长度限制为100。 我怎样才能做到这一点。下面的代码会废弃或抓取页面正文并获取其内容,但也会废弃或抓取页面正文及其源代码。请问如何废弃/抓取页面正文中的文本并在输出之前将字符限制为100
libxml_use_internal_errors(true);
$dom = new DOMDocument;
$dom->loadHTMLFile($url);
libxml_use_internal_errors(false);
$body = $dom->getElementsByTagName('body')->item(0);
echo $body->textContent;
答案 0 :(得分:0)
$body_output = substr($body->textContent, 0, 100);
echo $body_output;