Html dom解析器php表

时间:2015-06-10 08:08:57

标签: php html parsing dom simple-html-dom

这是我的表

Invoice

我上面表格的Html代码是

Grapes    1     25     25
Mangoes   2     30     60
Apple     5     10     50

上表是我的html代码中的第4个表

我的PHP代码是

<table>
<tr>
<td><font>Grapes</font></td>
<td><font>1</font></td>
<td><font>25</font></td>
<td><font>25</font></td>
</tr>
<tr>
<td><font>Mangoes</font></td>
<td><font>2</font></td>
<td><font>30</font></td>
<td><font>60</font></td>
</tr>
<tr>
<td><font>Apple</font></td>
<td><font>5</font></td>
<td><font>10</font></td>
<td><font>50</font></td>
</tr>
</table>

这里$ result保存来自curl执行的html代码

我的输出是

<?php
include('simple_html_dom.php');
$result = curl_exec($ch);
curl_close($ch);
$src = new DOMDocument('1.0', 'utf-8');
$src->formatOutput = true;
$src->preserveWhiteSpace = false;
@$src->loadHTML($result);
$xpath = new DOMXPath($src);
$values=$xpath->query('//table[4]//tr');

foreach($values as $value)
{
$rowdata = str_replace(">"," ",$value->nodeValue);
$n = explode("\n", $rowdata);
print_r($n);
}

但我希望输出为

Array ( [0] => Grapes12525 [1] => ) Array ( [0] => Mangoes23060 [1] => ) Array ( [0] => Apple51050 [1] => )

我试过

Array ( [0] => Grapes [1] => 1 [2] => 25 [3] => 25 ) Array ( [0] => Mangoes [1] => 2 [2] => 30 [3] => 60 ) Array ( [0] => Apple [1] => 5 [2] => 10 [3] => 50 )

但是这会将每个值打印为数组

是否有任何方法可以让我们在for循环中获取子元素,例如只有td&#39; s在父tr中或任何其他方式来实现这个

请帮我解决这个问题

谢谢

1 个答案:

答案 0 :(得分:0)

我会尝试:

$rowdata = explode(' ', $value->textContent);

文本内容应该是以空格分隔的tr子项的整个文本。

如果这不起作用。在foreach循环中使用 // td $ value 作为上下文节点执行另一个xpath查询。