我有HTML文档,其中包含许多具有以下格式的记录:
<tr><td>af</td><td>Afrikaans</td></tr>
请告诉我,如何使用正则表达式提取“af”和“南非荷兰语”?谢谢。
答案 0 :(得分:1)
这只是一个简单的例子,可以帮助您入门,但根据HTML的结构,您需要进行一些调整:
$s = <<<EOM
<tr><td>af</td><td>Afrikaans</td></tr>
EOM;
$d = new DOMDocument;
$d->loadHTML($s);
foreach ($d->getElementsByTagName('td') as $node) {
echo $node->nodeValue;
}
另请参阅DOMDocument
文档
答案 1 :(得分:0)
你应该使用DOM,SAX,SimpleXML,PHPQuesry,整理而不是正则表达式来解析XML