使用simple_html_dom结果删除h1的类和样式

时间:2015-03-13 19:02:51

标签: php html css simple-html-dom

以下是我的代码:

$html = $_GET['html'];
$dom = file_get_html($html);
$h1 = $dom->find('h1');
echo $h1[0];

它返回H1文本,但与最初关联的类一起返回。喜欢:

<h1 class="postpageheading">the returned text </h1>

我只想要文字,甚至没有标签。

我该怎么做? 感谢。

2 个答案:

答案 0 :(得分:1)

尝试:

echo $h1[0]->plaintext;

从您的file_get_html方法看起来您正在使用PHP Simple HTML DOM Parser。

如果你看一下他们的快速入门:

http://simplehtmldom.sourceforge.net/

点击“从HTML中提取内容”标签,它会显示如何使用此plaintext获取没有标记的内容。

答案 1 :(得分:1)

您可以对结果运行正则表达式,如:

$result = preg_replace("/[^A-Z]+/", "", $string);

strip_tags如下所述:http://php.net/strip_tags