以下是我的代码:
$html = $_GET['html'];
$dom = file_get_html($html);
$h1 = $dom->find('h1');
echo $h1[0];
它返回H1文本,但与最初关联的类一起返回。喜欢:
<h1 class="postpageheading">the returned text </h1>
我只想要文字,甚至没有标签。
我该怎么做? 感谢。
答案 0 :(得分:1)
尝试:
echo $h1[0]->plaintext;
从您的file_get_html
方法看起来您正在使用PHP Simple HTML DOM Parser。
如果你看一下他们的快速入门:
http://simplehtmldom.sourceforge.net/
点击“从HTML中提取内容”标签,它会显示如何使用此plaintext
获取没有标记的内容。
答案 1 :(得分:1)
您可以对结果运行正则表达式,如:
$result = preg_replace("/[^A-Z]+/", "", $string);
或
strip_tags
如下所述:http://php.net/strip_tags