屏幕废料或爬网下拉字段,包含来自其他站点的所有排列

时间:2011-01-07 06:32:48

标签: .net web-crawler

您好 首先,我需要问一下爬虫和屏幕抓取之间的区别。 其次我想抓取或筛选具有不同排列的废料下拉字段,以便我可以在我自己的数据库中获取该数据。当我选择一个类别时,有一个类别下拉,然后当我选择其子类别时填充其相关的子类别它的相关子类别是用不同的组合填充的等等。我想要的是带有不同排列的类别存储在我的数据库中。 我将使用C#.net

非常感谢任何帮助。

感谢。 Waqar Iqbal。

1 个答案:

答案 0 :(得分:0)

抓取 - 收集有关网页的信息,并确定其结构和价值。

屏幕抓取 - 在网页内收集内容并存储/使用内容。

这都可以使用.NET WebBrowser control及其内部函数(您可以从HtmlElement收集信息)来完成