从纯文本html页面中选择信息

时间:2016-02-16 21:49:05

标签: php html

我有这个php页面:

header('Content-type: text/plain');
$homepage = file_get_contents("http://www.cinecity.nc/default.asp");
echo $homepage;

它返回网站" cinecity"用纯文本。

现在,在html文本中有以下几行:

title="DEADPOOL # 13h55 - 17h30 - 20h25 (sauf Dim.) 
title="DIRTY PAPY # 13h30 - 15h55 (uniquement Merc., Sam., Dim.) 

如何选择所有标题并将其放入我的数据库?

我怎样才能检索小时数?

Thx

2 个答案:

答案 0 :(得分:1)

你可以使用preg_match或preg_match_all php函数来使用正则表达式来提取你想要的东西,你可以查看php函数的文档http://php.net/manual/fr/function.preg-match-all.php

答案 1 :(得分:0)

你的问题不是那么清楚,无论如何我认为你应该在$homepage中解析你的整个文件并获取“title =”,而不是把剩下的字符串保存起来。

RegEx非常适合此目的,在this site上复制$homepage并测试您的RegEx