如何从亚马逊获取产品信息,仅基于URL?

时间:2009-05-23 17:34:48

标签: ruby-on-rails ruby amazon

我只是链接到亚马逊的产品页面。如何在我的ruby程序中使用此链接获取所有信息(照片,价格等)?

5 个答案:

答案 0 :(得分:7)

以下是亚马逊公布的支持网址列表,其中包含的oembed产品广告API只有在解析完这些网址并获取ASIN后才会显示

  

HTTP:// 亚马逊 / GP /产品/ *

     

HTTP:// 亚马逊 / / DP /

     

HTTP:// 亚马逊 / DP / *

     

HTTP:// 亚马逊 / O / ASIN / *

     

HTTP:// 亚马逊 / GP /报价-列表/ *

     

HTTP:// 亚马逊 / / ASIN /

     

HTTP:// 亚马逊 / GP /产品/图片/ *

     

HTTP:// 亚马逊 / GP / AW / d / *

     

http://www.amzn.com/ *

     

http://amzn.com/ *

答案 1 :(得分:2)

我找到了这个库(我正在使用Rails) 亚马逊ECS 我正在试验它。不过,我需要某种ID(产品ID?)才能获得特定产品的详细信息。例如,请考虑此链接到kindle

http://www.amazon.com/Kindle-Amazons-Wireless-Reading-Generation/dp/B00154JDAI/ref=amb_link_84372271_1?pf_rd_m=ATVPDKIKX0DER&pf_rd_s=center-1&pf_rd_r=06JJGQP9J3BHKPE38SXP&pf_rd_t=101&pf_rd_p=478184871&pf_rd_i=507846

在那个链接中,我注意到ASIN,即B00154JDAI。

看起来我可以使用此ID来获取产品信息(使用amazon-ecs)。我只需解析URL即可获得ASIN。

还有其他办法吗?

不,我不打算进行屏幕抓取,这不是一个好主意。

答案 2 :(得分:1)

如果您想这样做,Nokogirihpricot库都允许HTML解析和搜索。然而,这种屏幕抓取是众所周知的不可靠(因为它可能会破坏亚马逊决定重新组织他们的HTML),所以如果你计划在任何时间长度做这种事情,我建议利用{ {3}}而不是。

答案 3 :(得分:0)

在你的程序中:获取页面并解析HTML。过滤掉所需的信息。 Ruby中可能有一些库(我不知道),它解析HTML。

hpricot似乎做你想做的事。

答案 4 :(得分:0)

你应该使用Ruby / AWS库(谷歌为它,我的业力不够高,不允许外部链接......)。它已经写完了。

您可能需要使用内置搜索来查找您要查找的项目。之后,API可以访问图片,链接和所有可用信息。