我正在尝试遍历URL列表并将div标签中的内容保存到文本文件中。
<?php
$file = 'content.txt';
$i = 406;
for($i; $i <= 1410; $i++) {
$url = 'http://example.com/chapter/chapter-'.$i;
$content = file_get_contents($url);
$start_tag = explode( '<div class="textdiv">' , $content );
$end_tag = explode("</div>" , $start_tag[1] );
$result_text = $second_step[0];
echo $result_text;
$result = file_put_contents($file, $result_text);
}
?>
第一个问题是div标签与该类有多次出现,我希望得到该类的每个div,并且当前代码只输出第一次出现。
[编辑]
感谢阿尔法的帮助指引我正确的方向,这对我有用:
<?php
include_once('simple_html_dom.php');
$i = 399;
$file = 'content.txt';
for($i; $i < 1400; $i++){
$url = 'http://example.com/chapter/chapter-'.$i;
$html = file_get_html($url);
foreach ($html->find('div.textdiv') as $div) {
echo $div . '<br />';
$result = file_put_contents($file, $div );
}
echo '<hr><br /><h1>Chapter '. $i .'</h1><br /><hr>';
}
?>
一个问题是脚本运行需要很长时间。