导航到URL并从锚标记中获取href属性?

时间:2014-08-26 22:50:22

标签: javascript jquery html dom automation

我有一个让我们说... 10000个网址的列表。标记的结构相同,但某些DOM元素的属性对于URL是唯一的。

是否有人使用JavaScript:

  • 导航到网址?
  • 抓住一个DOM元素(在我的情况下,拉出特定锚标记的href attr)?

只是想朝着正确的方向努力。如果这样的事情存在,我打算编写一个循环来迭代所有10000个URL并DoSomething()与它们一起。

2 个答案:

答案 0 :(得分:1)

我建议使用Node.js:查看像Cheerio这样的Node模块,抓取你的URL并查看他们的DOM元素。应该是一个相对简单的脚本。

答案 1 :(得分:0)

成功!我能够使用C#控制台应用程序中的WebClient类和IHTMLDocument2接口到达那里。

WebClient Class Reference

IHTMLDocument2 Interface Reference