我正在寻找类似于PHP的DOMDocument-> loadHTMLFILE()的javascript方法,这样我就可以解析外部html文件的内容并提取图像。现在我是通过ajax来做的,这太慢了。
这是我用来刮图像的PHP,它的工作原理。我只是想做同样的事情,但浏览器方面更快。
if(isset($_POST['link']) && $_POST['link'] !== ""){
//extract relevant article info from link
$sourceArray = array();
$sizeArray = array();
$link = $_POST['link'];
//generate new DOMdoc
$article = new DOMDocument;
$article ->loadHTMLFile($link);
//get the largest image
$images = $article->getElementsByTagName("img");
foreach($images as $image){
$source = $image->getAttribute("src");
if(strpos($source, "http://") !== false){
$sizeProfile = getimagesize($source);
$imgArea = $sizeProfile[0] * $sizeProfile[1];
if($imgArea > 100){
array_push($sizeArray, $imgArea);
array_push($sourceArray, $source);
}
}
}
array_multisort($sizeArray, SORT_DESC, $sourceArray);
$sourceHTML = "";
$i = 0;
foreach($sourceArray as $source){
$id = 'image'.$i;
$sourceHTML .= '<img id="'.$id.'" class="notSelectedPicture" src="'.$source.'" onclick="toggleSelectedPicture(\''.$id.'\');" alt="alt">';
$i++;
}
echo $sourceHTML;
exit();
}
答案 0 :(得分:1)
ajax解决方案可用于此目的。作为客户端语言,JS似乎无法以PHP的方式获取和解析外部html文件。为了减少加载时间,应该关注ajax发布的dom解析代码的效率。