我正面临网络抓取功能问题。
我有一个带有问题和选项的html文件。
我的疑问:
如果某些问题包含没有<p>
标记的表格标记,例如
那么我的代码只返回<p> </p>
仅标记文本。我还需要<p> </p>
表</table>
标记内容。
请澄清一下,如何解决此问题?
谢谢
答案 0 :(得分:0)
首先,您应该学习使用code
标签在帖子中添加代码,以便于阅读和回答。根据您的代码,您的代码只检查<p
部分,如果不存在,则该部分必须位于行的开头,否则您的代码将跳到下一行。
要解决此问题,您可能需要检查<td
,然后<p
使用if ... else
来区分代码。
答案 1 :(得分:0)
简单地说,你必须做这样的事情:
foreach($html->find('p') as $p){
if($p->nextSibling() && $p->nextSibling()->tag == 'table'){
$table = $p->nextSibling();
echo $p;
echo $table;
}
}