将HTML表保存为xml或json

时间:2012-04-03 21:17:32

标签: c# xml linq

我正在寻找一种将表格从html页面保存为xml或json的方法。我正在使用的当前方法将整个页面保存为xls工作表,然后使用Office.InterLop.Excel读取工作表。我想跳过保存文件,只需使用HttpRequest直接从页面读取。有什么想法吗?

1 个答案:

答案 0 :(得分:1)

我认为你的意思是你想要在没有File->的情况下刮掉网页的内容。另存为? Code project has a writeup解释使用HttpWebRequest来做到这一点。或者,您可以使用较新的HttpClient。检索HTML后,您必须自己解析它。

MSDN artticle中,他们实际上直接请求JSON,因此他们不必处理解析,但您可以非常轻松地编写RegularExpression来捕获表体。< / p>