Question

我不知道该做什么或从哪里开始。

我想要做的是使用PHP来读取HTML页面并提取div中包含的原始文本

div就是这个

 <div class="thingy">
  test
 </div>

执行php时，我希望它回显

Test

是否有一个简单的代码段，或者有人发布一个小脚本？

编辑：带有Div的html页面位于另一个网页上。

Answer 1

您要做的是解析HTML。使用PHP附带的DOM模块执行此操作：http://php.net/manual/en/book.dom.php

您不想尝试使用正则表达式执行此操作。

如果要从文档中删除所有HTML标记，请使用PHP strip_tags()函数：http://us3.php.net/strip_tags

Answer 2

虽然可以使用正则表达式来完成，但我建议使用DOM解析器。我的建议是SimpleHTML Dom Parser。使用它，这就是你想做你想做的事情

$string = "<div class=\"thingy\">test</div>";
$html = str_get_html($string); // create the DOM object
$div = $html->find('div[class=thingy]', 0); // find the first div with a class of 'thingy'
echo $div->plaintext(); // echo the text contents

Answer 3

如果你想解析你的HTML，你可以像

一样使用它

<?php
 $str = '<div class="thingy">test</div>';
 echo strip_tags($str);//OUTPUT : test
?>

由于你的html在其他网页上，启动输出缓冲包括你的主php脚本中的那个文件，对它进行所有操作以获取内容。

使用PHP来回显div标签中的内容

3 个答案: