我有一个让我们说... 10000个网址的列表。标记的结构相同,但某些DOM元素的属性对于URL是唯一的。
是否有人使用JavaScript:
只是想朝着正确的方向努力。如果这样的事情存在,我打算编写一个循环来迭代所有10000个URL并DoSomething()
与它们一起。
答案 0 :(得分:1)
我建议使用Node.js:查看像Cheerio这样的Node模块,抓取你的URL并查看他们的DOM元素。应该是一个相对简单的脚本。
答案 1 :(得分:0)
成功!我能够使用C#控制台应用程序中的WebClient
类和IHTMLDocument2
接口到达那里。