我不知道该做什么或从哪里开始。
我想要做的是使用PHP来读取HTML页面并提取div中包含的原始文本
div就是这个
<div class="thingy">
test
</div>
执行php时,我希望它回显
Test
是否有一个简单的代码段,或者有人发布一个小脚本?
编辑:带有Div的html页面位于另一个网页上。
答案 0 :(得分:5)
您要做的是解析HTML。使用PHP附带的DOM模块执行此操作:http://php.net/manual/en/book.dom.php
您不想尝试使用正则表达式执行此操作。
如果要从文档中删除所有HTML标记,请使用PHP strip_tags()
函数:http://us3.php.net/strip_tags
答案 1 :(得分:2)
虽然可以使用正则表达式来完成,但我建议使用DOM解析器。我的建议是SimpleHTML Dom Parser。使用它,这就是你想做你想做的事情
$string = "<div class=\"thingy\">test</div>";
$html = str_get_html($string); // create the DOM object
$div = $html->find('div[class=thingy]', 0); // find the first div with a class of 'thingy'
echo $div->plaintext(); // echo the text contents
答案 2 :(得分:0)
如果你想解析你的HTML,你可以像
一样使用它<?php
$str = '<div class="thingy">test</div>';
echo strip_tags($str);//OUTPUT : test
?>
由于你的html在其他网页上,启动输出缓冲包括你的主php脚本中的那个文件,对它进行所有操作以获取内容。