直截了当:我想解析html页面的源/ DOM。但是我不能,因为缺少需要javascript和ajax的信息。
我正在使用C#和.NET。有一个网站使用ajax浏览页面。我感兴趣的两个部分是wiki和媒体部分。如果我有媒体或维基页面的链接,我可以解决它没有问题。然而,这个网站使用ajax和javascript浏览页面(页面大小很可怕,我认为这是出于性能原因)。
链接的格式为。我想知道,有没有办法可以轻松解析这些页面?也许使用IE控件并执行类似ie.set(“htmlpage”,“4”)的操作; ie.run();解析(ie.source());