Web爬网和入站链接提取

时间:2011-12-22 12:22:43

标签: c# asp.net

我正在搜索一个c#函数,该函数将Url作为参数并返回与该url相关的所有入站网址。

2 个答案:

答案 0 :(得分:0)

您可以使用WebClient类“

”“下载”网页
String url = "http://www.google.com";

WebClient client = new WebClient();
String source = client.DownloadString(url);

然后你需要搜索所有的URL。我很乐意为你写一个RegEx,如果你努力找到你没有的答案,显然。

编写其中一个正则表达式相当困难,因为有许多不同的东西需要匹配:

  • 相对网址
  • 绝对网址
  • IP的
  • 您必须考虑base代码
  • 仅当他们使用特定代码(aimglinkscript以及其他内容时<)

祝你好运

答案 1 :(得分:0)

根据您的描述,您想找到“入境”? url是一个URL。如果是这种情况,您需要连接到API以检索该信息。我不认为谷歌有一个,但我知道它们存在。