在C#中从网站获取价值的简便方法

时间:2013-12-28 23:17:43

标签: c# regex webclient

我有以下问题! 我想从网站上获取运费数据。它们具有以下结构:

enter image description here

这里的问题是有多个div,在div中有更多的div和表。 由于我是一个带有正则表达式的总菜鸟,我想知道是否有更容易的解决方案来获取数据。

1 个答案:

答案 0 :(得分:4)

我建议使用像HTML Agility Pack这样的框架来使用DOM,而不是使用正则表达式。请阅读此处以获取更多信息:http://html-agility-pack.net

更具体地说,当使用HTML Agility Pack时,作为手动DOM遍历的替代方法,您可以使用XPath来定义要从中获取数据的元素。您可以编写非常灵活的XPath,即使它们被移动或格式化不同(例如,属性不同),也能识别正确的元素。将XPath视为CSS选择器,但更强大,学习曲线更陡峭。

至于正则表达式,you have been warned