想要从其他网站链接检索元数据和Meta内容

时间:2012-02-23 12:57:22

标签: jquery asp.net wcf metadata meta-tags

我正在开展社交网络项目。 这是基于asp.net 4.0,WCF和JQuery。 在我的项目中,有一个模块用于从中提取元数据和元包含 其他网站网址。 示例 - 如果我将提供URL,那么它将检索详细信息 -

网址 - http://timesofindia.indiatimes.com

元数据 - 印度时报:最新消息印度,世界&商业新闻,板球  &安培;体育,宝莱坞

元内容 - 印度时报带来了最新的&关于政治和政治的最新突破新闻  印度当代事务&环游世界,板球,体育,  商业,宝莱坞新闻和娱乐,科学,技术,  健康与健康健身新闻&主要专栏作家的意见。

我搜索了很多但却无法得到任何线索 任何人都可以通过发送一些代码或通过一些有用的链接来帮助我,我可以得到一些参考或信息。

1 个答案:

答案 0 :(得分:1)

现在几天,网站都没有从其他网站上抓取数据 - 他们联合起来。也就是说,它们通过易于使用的界面共享信息。有一些技术,但常见的格式是使用RSS,它以XML格式呈现数据供您使用。

该特定网站提供了一系列RSS feeds。但是,请记住阅读use的条款,因为它的使用可能会受到限制。当然,你仍然可以采取刮擦行动,但是有法律要求将受版权保护的材料声称为你自己的。