有什么方法可以将HtmlElement(.NET)与JavaScript元素相关联?

时间:2010-06-26 06:36:21

标签: c# .net

我正在尝试使用突出显示文本以及获取Web Scraper的元素属性或属性等内容来制作WebBrowser的扩展版本。 WebBrowser函数根本没用,所以如果我能找到从HtmlElement到JavaScript元素的方法(比如document.getElementById返回的那个),然后返回,然后添加JavaScript从我的应用程序到HTML的功能,它将使工作更容易。现在,我正在以编程方式从C#中弄乱代码的HTML,这非常混乱。我正在考虑为我的程序中的每个HTML元素设置一些唯一的ID,然后调用JavaScript document.getElementById来检索它。但这不起作用,他们可能已经分配了Id,我将搞乱他们的HTML代码。我不知道我是否可以给他们一些像my_very_own_that_i_hope_no_web_page_on_the_world_ever_uses_attribute这样的组成属性,然后弄清楚是否有一些JavaScript函数getElementByWhateveAttributeIWant但是我不确定这是否有效。我在msdn中阅读了有关DOM文档的扩展或扩展属性的内容,但我不确定它是什么。也许你们中的一些人有更好的方法。

2 个答案:

答案 0 :(得分:0)

使用像trident这样的渲染引擎从html文档中获取数据要容易得多。以下是trident / MSHTML的Link。你可以做谷歌,并可以在c#

中有样品

答案 1 :(得分:0)

这并不像你想象的那么难。您根本不必修改文档。

一旦WebBrowser加载了一个页面,它就会在内部保存为树,其中document节点位于根目录下。此节点可供您的程序使用,您可以通过遍历树找到所需的任何元素(或者只是枚举它们)。

如果你能举一个具体的例子,我可以提供一些代码。