如何以编程方式PARSE HTML文件和SUBMIT信息

时间:2010-10-22 05:17:54

标签: c# asp.net web-applications parser-generator

ASP.NET 4& C#和

我想知道哪些CODE,类可以用于创建可以的WEB应用程序:

01 - Connect to an HTML file on the web.
02 - Parse its content (text content).
03 - Find out specific content in a page (for example looking for specific keywords).

另外如何实施:

04 - How to submit information programmatically in HTML page (feeling forms).

我有兴趣了解类和通用实践以及完成此任务的CODE。

如果您有任何想法,请告诉我。再次感谢你们的支持! : - )

3 个答案:

答案 0 :(得分:1)

我不确定你是否希望你提到的所有内容都执行'服务器端',但假设是这种情况:

  

01 - 连接到的HTML文件   幅。

查看WebClient课程和HttpWebRequest课程,了解更多高级情景。

  

02 - 解析其内容(文本内容)。   03 - 找出一个特定的内容   页面(例如寻找具体的   关键字)。

您可能需要查看Html Agility Pack,或者Bobince是否注意到regular expressions

  

04 - 如何提交信息   以编程方式在HTML页面中(感觉   形式)。

通常,这需要发送HTTP POST请求,这也可以通过HttpWebRequest类完成。

答案 1 :(得分:1)

要解析网页,请查看HTML Agility pack
对于表单传递,您需要使用Firebug或Internet Explorer开发人员工具等工具,或使用Wireshark之​​类的嗅探器查看通过网络发送的内容。
在您的情况下,我还会考虑将其拆分为单独的组件,以便您可以轻松地测试过程的各个部分。

答案 2 :(得分:0)

使用HttpWebRequest来调用对网页上的页面的请求。

然后,您可以解析HTML响应。

要以编程方式提交表单,我认为您需要在客户端(JavaScript)执行此操作:

document.forms[0].submit();