C# - 使用HTMLAgilityPack获取JavaScript变量值

时间:2011-06-11 09:27:14

标签: c# javascript

我目前有2个JavaScript变量,我需要从中检索值。 HTML由一系列没有id / name属性的嵌套DIV组成。是否可以使用HTMLAgilityPack从这些变量中检索数据?如果是这样的话,我怎么会这样做,如果不是什么需要,正则表达式?如果是后者,请帮我创建一个允许我这样做的正则表达式。谢谢。

<div style="margin: 12px 0px;" align="left">
<script type="text/javascript">
variable1 = "var1";
variable2 = "var2";
</script>
</div>

1 个答案:

答案 0 :(得分:3)

我假设您正试图从网站上抓取这些信息?很可能是你没有直接控制权?有几种方法可以做到这一点,我会很容易(至少我看到它):

  1. 询问(网站的)所有者。大多数情况下,他们可以直接访问您的信息,如果您提出要求,他们可能会让您免费获得该信息

  2. 您可以使用webBrowser控件,运行javascript,然后再解析DOM中的值。与HttpWebRequest相反,这允许在页面上加载所有正确的值并进行擦除。 Helpful Link Here.

  3. 使用Firebug.窃取源代码使用Firebug检查网站,以查看从后台调用的URL。最有可能的是,它使用异步请求从Web服务中检索更新的信息。使用Firebug,您可以在NET下查看 - > XHR。查看请求和返回的值,然后您可以检索自己的值并从源解析内容而不是刮取页面。

  4. 我认为这可能是您要查找的信息,但如果没有让我知道,我可以澄清/修复答案