从网页列表中提取H1标题

时间:2014-01-24 15:26:28

标签: macros imacros

我有很长的网址列表,我想从每个网址中添加标题并将其保存到Microsoft Excel文件中。

我试着四处寻找代码来做到这一点,却找不到它。我正在使用iMacros for Firefox。

2 个答案:

答案 0 :(得分:0)

我建议在excel VBA本身中使用Internet Explorer对象和MSHTML对象库,这可能会使用第三方应用程序。

答案 1 :(得分:0)

首先需要文件中的URL列表(每行一个URL)。我们称之为listOfUrls.csv(从Excel中保存或只使用纯文本文件)。您将该文件放在iMacros / Datasources文件夹中。

然后是宏本身:

SET !DATASOURCE listOfUrls.csv
SET !DATASOURCE_COLUMNS 1
SET !LOOP 1
SET !DATASOURCE_LINE {{!LOOP}}
TAB T=1
URL GOTO={{!COL1}}
TAG POS=1 TYPE=TITLE ATTR=* EXTRACT=TXT
SAVEAS TYPE=EXTRACT FOLDER=* FILE=openThisInExcel.csv

现在你必须将宏作为循环播放(寻找“播放(循环)”)。播放次数与列表中的URL一样多(在“Max:”中设置)。然后宏将带您到每个URL并获取标题并将其保存到openThisInExcel.csv中。就是这样。

您可能还希望将URL保留在结果CSV中(以便您知道哪个标题对应于哪个URL)。在最后一行或该行之前的行之前添加以下内容(取决于您想要的列顺序):

ADD !EXTRACT {{!URLCURRENT}}