如何用PHP和正则表达式在HTML中的特定标签之间提取文本?

时间:2017-08-28 07:05:56

标签: php regex

我在stackoverflow中搜索了我的答案,但找不到任何内容。

我的问题是如何在特定标签之间提取特定文本,如果文本的第一个单词在标签内找到,则抓住它直到结束

这是我的代码

$homepage = file_get_contents('http://www.time.com/');
$homepage=htmlentities($homepage);
echo $homepage;

例如它给我输出

<div>
<span class="12334d">first text in url</span>
<span id="asdasd2">second text in url</span> <br />
<span class="ddie8">third text in url</span>
<span>something else in url</span> <br/>
<span>special thing is here</span>
<span>something else in web</span>
</div>

所以我想在网址中抓取&#34; 其他内容&#34;和&#34; 网络上的其他内容&#34;当正则表达式找到第一个单词&#34; 某些东西&#34;抓住文本直到...之间结束...并将其放在字符串中。 感谢。

1 个答案:

答案 0 :(得分:1)

你可以使用正则表达式

[^>]*something[^<]*

请参阅regex demo