我正在使用Parse创建一个目前适用于iPhone的广告资源应用,以便公司跟踪他们的所有工具,耗材和广告资源。现在,我想允许用户/公司在他们的数据库中添加新项目,以便他们可以选择从预先制作的项目数据库中搜索,例如在添加简单的Dewalt钻孔电池时为建筑公司搜索他们的库存将在预制数据库中搜索“Dewalt#DC9096 18V XRP 2.4A Battery”或办公室将按品牌/序列号/名称搜索铅笔。我正在寻找一种简单的方法来制作数据库甚至包含多个品牌产品的表格,包括价格,产品规格,订购网站,公司网站,保修电话号码等......我考虑过解析所有零售网站的信息,但不知道其背后的合法性,如果网站发生变化,我需要更新代码。如果有任何(更容易/更好)的方式来做到这一点,那么协助或指导会很棒!
总是谢谢
答案 0 :(得分:2)
我不会试图解析网站,这将是一个巨大的痛苦,除非你有广泛的资源(并且你提到它可能违反大多数网站的服务条款),否则无法维护。您最好的选择是通过API连接到现有的产品数据库,例如Google的Search API用于购物,或者亚马逊的API。如果您想使用Google,可以在这里开始:
https://developers.google.com/shopping-search/
希望这会让你朝着正确的方向前进。
编辑:这是一个很多购物API的列表,可能是不错的选择:
http://www.programmableweb.com/apis/directory/1?apicat=Shopping
答案 1 :(得分:1)
如果您确实发现自己需要解析许多不同的供应商网站(我们称之为“屏幕抓取”)并且您有合法权利这样做,那么您应该使用SelectorGadget之类的工具来获取XPath,它比手工操作更快,更容易,更容易出错。
但是,如果你做的不仅仅是几个网站,你可能会发现你必须经常更新抓取规则,这肯定不会是一个“一劳永逸”的操作。