我有1000多个网址,我想要从中检索标题信息。在尝试不同的东西之后,我最终使用了iMacros脚本,我对此一无所知。尽管如此,我还是在阅读了指南之后制作了一个剧本。
我的脚本工作正常,但问题很少,并且有一些疑问
我的剧本:
VERSION BUILD=9002379
TAB T=1
TAB CLOSEALLOTHERS
SET !TIMEOUT_STEP 1
SET !ERRORIGNORE YES
SET !EXTRACT_TEST_POPUP NO
URL GOTO=http://google.com/
ADD !EXTRACT {{!URLCURRENT}}
TAG POS=1 TYPE=TITLE ATTR=* EXTRACT=TXT
SAVEAS TYPE=EXTRACT FOLDER=d:/ FILE=links.txt
WAIT SECONDS=1
SET !TIMEOUT_STEP 1
SET !ERRORIGNORE YES
SET !EXTRACT_TEST_POPUP NO
URL GOTO=http://example.com:8087/
ADD !EXTRACT {{!URLCURRENT}}
TAG POS=1 TYPE=TITLE ATTR=* EXTRACT=TXT
SAVEAS TYPE=EXTRACT FOLDER=d:/ FILE=links.txt
我想问的是这个
1-我是否必须为每个URL使用SET!TIMEOUT_STEP 1,SET!ERRORIGNORE YES,SET!EXTRACT_TEST_POPUP NO或仅在顶部使用这些cmd一次?
2-甚至用SET!EXTRACT_TEST_POPUP没有我在开始http://i.imgur.com/8UP9uMD.jpg时得到此错误,如何删除???
很多网址中的3个我有一些已经死了,所以imacros等到60s然后转到下一个网址..如何减少死亡或无响应网址的时间到10? http://i.imgur.com/FGIXElq.jpg< - 如何限制10秒4-我制作的剧本是1个网址。现在我怎么能将这个脚本多次使用特定txt文件中的不同网址1000倍以上。 所以要么它为所有网址制作相同的脚本,要么自动从txt文件中提取网址,同时当第一个网址被提取时,它会从url txt文件中找到下一个网址并自动插入此脚本,以便它可以运行我的所有网址最后我得到了所有网址的结果
5-我得到的最终结果是
我如何更改是“,”后面的标签或双空格的URL,所以我的结果看起来像这样
http://google.com Google
请回复我的所有查询,如果可能的话重做我的脚本,以便我知道在哪里放哪个代码
谢谢!
答案 0 :(得分:1)
SET !DATASOURCE urls.txt
SET !DATASOURCE_LINE {{!LOOP}}
SET !TIMEOUT_STEP 1
SET !TIMEOUT_PAGE 10
SET !ERRORIGNORE YES
URL GOTO={{!COL1}}
SET !ERRORIGNORE NO
SET !EXTRACT_TEST_POPUP NO
TAG POS=1 TYPE=TITLE ATTR=* EXTRACT=TXT
SET dblSP " "
SET !EXTRACT {{!COL1}}{{dblSP}}{{!EXTRACT}}
SAVEAS TYPE=EXTRACT FOLDER=d:\ FILE=links.txt
WAIT SECONDS=1
以循环模式播放上述宏,其中'Max:'值等于txt文件中的行数。