Question

以下是我的代码：

$html = $_GET['html'];
$dom = file_get_html($html);
$h1 = $dom->find('h1');
echo $h1[0];

它返回H1文本，但与最初关联的类一起返回。喜欢：

<h1 class="postpageheading">the returned text </h1>

我只想要文字，甚至没有标签。

我该怎么做？感谢。

Answer 1

尝试：

echo $h1[0]->plaintext;

从您的file_get_html方法看起来您正在使用PHP Simple HTML DOM Parser。

如果你看一下他们的快速入门：

点击“从HTML中提取内容”标签，它会显示如何使用此plaintext获取没有标记的内容。

Answer 2

您可以对结果运行正则表达式，如：

$result = preg_replace("/[^A-Z]+/", "", $string);

或

strip_tags如下所述：http://php.net/strip_tags