我正在运行一个iMacros宏,用于浏览网站并将页面保存到文件中。我使用的是一个简单的脚本:
URL GOTO=http://myurl.com/
SAVEAS TYPE=HTM FOLDER=* FILE=*
问题是保存的HTML页面与使用File - >从Firefox保存时获得的页面不同。将页面另存为...并选择“网页,仅限HTML”。我觉得似乎iMacros在页面上完成了一些处理。例如这一行
<meta charset="utf-8" />
变为
<meta charset="utf-8">
这看起来很小但在某些情况下我的元素被反转,因此隐藏了一个错误关闭标签的问题。例如,我的页面有
</form></div>
它保存为
</div></form>
来自iMacros。
很遗憾,我在iMacros论坛上找不到任何关于此问题的参考。有什么想法吗?
答案 0 :(得分:0)
试试这段代码。
URL GOTO=http://myurl.com/
TAG POS=1 TYPE=HTML ATTR=CLASS:* EXTRACT=HTM
SAVEAS TYPE=HTM FOLDER=* FILE=*
另一种测试提取数据的简便方法是www.jsbin.com
答案 1 :(得分:0)
为我工作。
在开始脚本之前创建目录d:\ reports或其他
URL GOTO=http://your_url
'Uncomment for not show popup
'SET !EXTRACT_TEST_POPUP NO
TAG POS=1 TYPE=HTML ATTR=CLASS:* EXTRACT=HTM
SAVEAS TYPE=HTM FOLDER=d:\reports FILE=1.html