我只是链接到亚马逊的产品页面。如何在我的ruby程序中使用此链接获取所有信息(照片,价格等)?
答案 0 :(得分:7)
以下是亚马逊公布的支持网址列表,其中包含的oembed产品广告API只有在解析完这些网址并获取ASIN后才会显示
HTTP:// 亚马逊 / GP /产品/ *
HTTP:// 亚马逊 / / DP /
HTTP:// 亚马逊 / DP / *
HTTP:// 亚马逊 / O / ASIN / *
HTTP:// 亚马逊 / GP /报价-列表/ *
HTTP:// 亚马逊 / / ASIN /
HTTP:// 亚马逊 / GP /产品/图片/ *
HTTP:// 亚马逊 / GP / AW / d / *
答案 1 :(得分:2)
我找到了这个库(我正在使用Rails) 亚马逊ECS 我正在试验它。不过,我需要某种ID(产品ID?)才能获得特定产品的详细信息。例如,请考虑此链接到kindle
在那个链接中,我注意到ASIN,即B00154JDAI。
看起来我可以使用此ID来获取产品信息(使用amazon-ecs)。我只需解析URL即可获得ASIN。
还有其他办法吗?
不,我不打算进行屏幕抓取,这不是一个好主意。
答案 2 :(得分:1)
如果您想这样做,Nokogiri或hpricot库都允许HTML解析和搜索。然而,这种屏幕抓取是众所周知的不可靠(因为它可能会破坏亚马逊决定重新组织他们的HTML),所以如果你计划在任何时间长度做这种事情,我建议利用{ {3}}而不是。
答案 3 :(得分:0)
在你的程序中:获取页面并解析HTML。过滤掉所需的信息。 Ruby中可能有一些库(我不知道),它解析HTML。
hpricot似乎做你想做的事。
答案 4 :(得分:0)
你应该使用Ruby / AWS库(谷歌为它,我的业力不够高,不允许外部链接......)。它已经写完了。
您可能需要使用内置搜索来查找您要查找的项目。之后,API可以访问图片,链接和所有可用信息。