iMacros - 在TD标签内提取部分文本

时间:2011-11-17 18:32:10

标签: screen-scraping web-scraping imacros

请转到http://www.networksolutions.com/whois-search/reedandthomas.com

链接

我想仅提取文本的以下部分:

   Administrative Contact:
      Chilcoat, Dan  dchilcoat-rt@adelphia.net
      Reed & Thomas Electrical Contractors, Inc
      621 Hanover Pike
      Hampstead, Maryland 21074
      United States
      (410) 239-9680

   Technical Contact:
      Chilcoat, Dan  dchilcoat-rt@adelphia.net
      Reed & Thomas Electrical Contractors, Inc
      621 Hanover Pike
      Hampstead, Maryland 21074
      United States
      (410) 239-9680

并将其保存在excel表中,每栏中都包含“管理联系人”和“技术联系人”详细信息。

我之前曾在iMacros工作,但我知道如何提取。对于我使用的另一个项目

URL GOTO=http://www.yellowbook.com/yellow-pages/?what={{!COL2}}&where={{!COL1}}
TAG POS=6 TYPE=STRONG ATTR=TXT:* EXTRACT=TXT
SAVEAS TYPE=EXTRACT FOLDER=d:\ FILE=results.txt

用于从yellowbook.com提取特定数据

这个whois提取对我来说有点挑战,因为它不是我追求的整个TD内容,而是TD内容的一部分(仅限管理联系人和技术联系人详细信息)。我正在为firefox使用iMacros浏览器插件。我还拥有iMacros浏览器的许可副本,以防您的解决方案要我使用它。

请帮忙吗?

1 个答案:

答案 0 :(得分:1)

当然,如果您有iMacros Scripting Interface,则可以在保存之前使用任何脚本语言来操作提取。

然而,最近在iMacros for Firefox和iMacros Browser(以及IE插件)中引入了一项新功能,它允许人们使用javascript的eval在iMacros代码中操作提取的字符串。

我建议您查看详情http://wiki.imacros.net/EVAL