从imacros中的链接中提取文本

时间:2017-07-07 09:49:31

标签: imacros

这是我的HTML标记

<div class="labValu">
<a id="project-link-16363353" class='stop-propagation' href="/Haware-Pinnacle-Kalyan-West-Thane-pdpid-4d4235303831393334" target="_blank">Haware Pinnacle</a>
</div>

我试图提取文字&#34; Haware Pinnacle &#34;那我试着做了

TAG POS=1 TYPE=a ATTR=target:_blank&&TXT:* EXTRACT=TXT

但是我得到了这个文字&#34; Post Property Free&#34; 我也试过

TAG POS=1 TYPE=A ATTR=HREF:link EXTRACT=TXT

所以这给了我

#EANF# 我该怎么做呢。 任何帮助将不胜感激..谢谢

1 个答案:

答案 0 :(得分:1)

以下是您的解决方案:

TAG POS=1 TYPE=A ATTR=* EXTRACT=TXT

您需要知道您尝试提取的Anchor的位置。因此,如果它始终是第一个链接,那么上面的代码将起作用。如果它是第7个链接,那么下面的代码将起作用。

TAG POS=7 TYPE=A ATTR=* EXTRACT=TXT

但是,如果链接的位置是动态的,那么您将必须使用相对定位(例如POS=R1),这可以在此处详细说明:http://wiki.imacros.net/Data_Extraction#Extract_with_relative_Positioning我建议您找到一个易于识别的标签,然后找到您尝试从中提取的链接的相对位置。下面的代码将查找与其当前位置相关的下一个可用超链接并提取文本。

TAG POS=R1 TYPE=A ATTR=* EXTRACT=TXT