我想提取网页中可用的所有链接并进行阅读。但是使用HTML模式我们可以监视单个链接。不作为链接列表。有人可以帮帮我吗?
答案 0 :(得分:1)
您可以使用导航阶段操作"插入Javascript片段"插入将读取所有a
标记href
属性的Javascript代码,并以管道分隔的方式输出它们。下面的功能应该让你开始:
function getLinks() {
var output = ""; // instantiate string variable
var links = document.getElementsByTagName("a"); // enumerate all anchor tag nodes
for (var i = 0; i < links.length; i++) { // loop results
if (i != 0) { // if this isn't the first item in the list...
output = output + "|"; // add a pipe between each URL
}
output = output + links[i].getAttribute("href"); // append the href attribute for each link
}
return output; // return the enumerated string
}
必须添加的唯一剩余Javascript行是将管道分隔列表放置到页面上的特定位置以供Blue Prism读取的功能。
答案 1 :(得分:0)
您可以使用例如操作&#34;获取HTML&#34;然后使用正则表达式获取每个链接标记,并获取&#34; href&#34;的属性。属性。