Question

我正在尝试遍历URL列表并将div标签中的内容保存到文本文件中。

<?php
$file = 'content.txt';
$i = 406;
for($i; $i <= 1410; $i++) {
    $url = 'http://example.com/chapter/chapter-'.$i;
    $content = file_get_contents($url);

    $start_tag = explode( '<div class="textdiv">' , $content );
    $end_tag = explode("</div>" , $start_tag[1] );
    $result_text = $second_step[0];
    echo $result_text; 
    $result = file_put_contents($file,  $result_text);
}
?>

第一个问题是div标签与该类有多次出现，我希望得到该类的每个div，并且当前代码只输出第一次出现。

[编辑]
感谢阿尔法的帮助指引我正确的方向，这对我有用：

<?php
include_once('simple_html_dom.php');

$i = 399;
$file = 'content.txt';

for($i; $i < 1400; $i++){
$url = 'http://example.com/chapter/chapter-'.$i;
$html = file_get_html($url);
foreach ($html->find('div.textdiv') as $div) {
    echo $div . '<br />';
   $result = file_put_contents($file,  $div );
}
echo '<hr><br /><h1>Chapter '. $i .'</h1><br /><hr>';
}
?>

一个问题是脚本运行需要很长时间。

循环访问URL列表并将内容保存到文本文件

0 个答案: