将HtmlAgility Pack和Abot Web Crawler添加到Project

时间:2014-03-26 20:04:01

标签: web-crawler html-agility-pack

我使用“Abot”版本1.2.3.1但是当我将“Html Agility”版本1.4.6.0添加到项目时我收到此错误:

  

错误38汇编'Abot,版本= 1.2.3.1,文化=中立,   PublicKeyToken = null'使用'HtmlAgilityPack,版本= 1.4.7.0,   Culture = neutral,PublicKeyToken = bd319b19eaf3b43a'哪个更高   版本比引用程序集'HtmlAgilityPack,版本= 1.4.6.0,   Culture = neutral,PublicKeyToken = bd319b19eaf3b43a'

3 个答案:

答案 0 :(得分:3)

我知道这已经过时但我刚遇到这个问题。也就是说,当我添加最新版本的HAP时,Abot没有工作。但是解决方法很简单,只需使用CSQueryHyperlinkParser来解析链接。像这样:

var crawler = new Abot.Crawler.PoliteWebCrawler(config, null, null, null, null, new Abot.Core.CSQueryHyperlinkParser(), null, null, null);

这解决了我的问题。

答案 1 :(得分:2)

我从NuGet Before Abot安装了HtmlAgilityPack并解决了问题!

1-
PM> Install-Package HtmlAgilityPack
2-
PM> Install-Package Abot

答案 2 :(得分:2)

Abot使用修补版本的html敏捷包,因为它会使某些类型的html页面上的进程崩溃。请参阅此处记录的问题......

https://code.google.com/p/abot/issues/detail?id=77&can=1&q=htmlagilitypack

github上有一个问题是调查这是否仍然是html敏捷包的nuget版本的问题(我非常确定)。因此,在nuget版本不会崩溃主机进程之前,Abot会保留它的修补版本的html敏捷包。

https://www.google.com/url?q=https%3A%2F%2Fgithub.com%2Fsjdirect%2Fabot%2Fissues%2F25&sa=D&sntz=1&usg=AFQjCNEpS2q4AuuejXdc3F8P2cVB-VtSSQ