如何通过curl从表中提取数据?

时间:2012-11-27 15:04:10

标签: php xml curl

如何使用php提取表格数据<table bgcolor="#004e8e" width="100%" align="center" cellpadding="3" cellspacing="0" id="borda_bai">网站http://www.orientcinemas.com.br/programacao/cinema.php?cod=5

另一个问题是如何将每个数据表放在xml中?

Ex:同一网站的表格

  

C1 C2 C3 C4 C5   
L1 L1 L2
L4
L5

在xml中 C1L1 =&gt;

<C1>
<L1> </ L1>
<L2> </ L2>
</ C1>
便于处理/使用数据:(

3 个答案:

答案 0 :(得分:1)

您可以使用XPathSelector

$xs = XPathSelector\Document::loadHTMLFile('http://www.orientcinemas.com.br/programacao/cinema.php?cod=5');
$table = $xs->select('//*[@id="borda_bai"][1]');
$result = array();
$row = 0;
foreach ($table->select('tr[position()>1]') as $tr) {
    $row++;
    $column = 0;
    foreach ($tr->select('td') as $td) {
        $column++;
        $result[$row][$column] = $td->extract();
    }
}

$结果将是

Array
(
    [1] => Array
        (
            [1] => 1
            [2] => 243
            [3] => A Saga Crep├║sculo: Amanhecer - Parte 2
            [4] => 12a.
            [5] => Dub. - 13h30, 16h00, 18h30, 21h00
        )
    etc......
)

答案 1 :(得分:0)

您可以使用Matthias Kerstner的HTML表格提取器。

  

http://www.kerstner.at/en/2011/02/html-table-extractor/

答案 2 :(得分:0)

Curl不这样做。 Curl用于发出请求。解析你描述的html可以用DOM,XPath和SimpleXML完成。