我正在使用php简单的dom解析器。我有一个网址列表(即urls.txt),我需要以纯文本格式下载。我在这里想要实现的是迭代网址,提取html /文本并逐步将提取的文本写入文本文件(即plain.txt)。我已经编写了两个单独的代码,但是我需要更多的洞察力才能成功地将它们集成到一个代码中以实现流程的自动化。谢谢。
<?php
include('simple_html_dom.php');
$Handler = fopen("urls.txt", "a+");
$Urls = fgets($Handler);
while (!feof($Handler)) {
$Urls = fgets($Handler);
echo $Urls ."<br />\n";
}
fclose($Handler);
?>
<?php
$html = file_get_html('http://example.com')->plaintext;
$Dump = fopen("plain.txt", "a+");
fwrite($Dump, $html);
fclose($Dump);
?>
答案 0 :(得分:0)
您可以为第二个脚本创建一个函数:
function func($url) {
$html = file_get_html($url)->plaintext;
$Dump = fopen("plain.txt", "a+");
fwrite($Dump, $html);
fclose($Dump);
}
然后你的第一个脚本变为:
include('simple_html_dom.php');
$Handler = fopen("urls.txt", "a+");
$Urls = fgets($Handler);
while (!feof($Handler)) {
$Urls = fgets($Handler);
func($Urls);
}
fclose($Handler);