旅行搜索引擎&聚合器获取源数据?

时间:2009-10-03 13:50:32

标签: web-crawler

我正在为旅游搜索引擎提出一些想法,我想知道这些网站如何获取他们的源数据。他们是否从航空公司主页中删除了所有内容?考虑到那里的航空公司数量,这似乎是一项巨大的工作。

每家航空公司是否也遵守某些API或网络服务标准?

我是否必须为每个希望索引的航空公司协商访问数据API?

4 个答案:

答案 0 :(得分:1)

在欧洲案例中,有一个名为tradedoubler的联盟平台似乎通过API提供此类信息。

http://www.tradedoubler.com/index.html

答案 1 :(得分:1)

这个答案有一些有用的链接:

https://stackoverflow.com/questions/527007/airline-reservation-systems/527200#527200

您还可以查看Amadeus和ITA网站(ITA最近bought by google),但它们非常昂贵。

当谷歌交易被批准时,我预计1年左右的时间内会出现这个领域的重大新闻。

@Fgblanch:链接网站似乎没有提供任何此类API,它们是某种在线广告代理商。

答案 2 :(得分:0)

我认为航空公司会将所有数据作为提要或网络服务公开 - 毕竟,为了让其他人尽可能轻松地出售他们的航班,这些都符合他们的利益。

虽然有趣的问题!

答案 3 :(得分:0)

聚合器不会抓取信息。他们也不需要。

航空公司提供集合商的座位和航班信息以代表他们出售。与这些网站合作通常符合航空公司的最佳利益,因为它们可以带来眼球,反过来更高的流失率和销售率来帮助卸载座位。

众所周知,航空公司也直接从自己的网站销售。这是集合商可以访问的相同信息,但航空公司本身有时会以稍微便宜的价格出售。

他们确实使用API​​,但不确定它是否符合标准格式。