Web Api从网站中提取信息

时间:2011-06-02 22:45:59

标签: javascript jquery python api

我需要一种从网页中提取标题并从json返回的服务。我不想解析网页或浪费任何不必要的CPU周期。 即呼叫应该是这样的:

curl http://api.someservice.com/fetch?url=google.com&element=title&out=json

api的回应是:

{
    response: {
        title: "Google"
        source: "google.com"
    }
    status: "success"

}

任何提示都将受到高度赞赏

2 个答案:

答案 0 :(得分:5)

你应该看看YQL - 这是来自雅虎的通用服务!这可以很容易地做到这种刮擦。试试这个:

select * from html where url="google.com" and xpath='//title'

Test it here.

答案 1 :(得分:1)

我怀疑雅虎的YQL可能与你正在寻找的非常接近。

(事实上,我认为简要描述YQL是什么,“从网站提取信息的网络API”: - )