我目前正在通过ActionScript HTMLLoader下载网站,以便以后可以访问DOM以从页面中获取一些信息。
问题是:页面上链接的每个资源(图像,样式表,javascript)也会加载,这需要一些额外的时间。我并不真的需要这些资源,因为只有普通的HTML / DOM很有趣。
有没有办法禁用链接资源的加载?起初我尝试使用URLLoader并将结果解析为XML,但是当网站无效时,这不起作用。我也没有找到一个库来验证/解析给定的HTML字符串为有效的XML。
我在桌面上使用Adobe AIR。
答案 0 :(得分:3)
也许很复杂,但您可以使用URLLoader加载文件,将其转换为字符串,使用正则表达式删除指向您不需要的外部资源的链接,然后将结果加载到HTMLLoader中。