我的应用程序需要根据提供的ISBN,标题或作者检索有关任何已发布图书的信息。这不是一个独特的要求---像Amazon.com,Chegg.com这样的网站,甚至像Book Collector这样的软件似乎都能够轻松地做到这一点。但我无法复制它。
为了澄清,我不需要搜索整个书籍数据库 - 只搜索已经输入的有限子集,如书籍集。数据库只是允许我用必要的元数据标记输入的书籍,以便能够搜索该书籍子集。因此,缩放不是问题 - 获取元数据是。
我尝试的选项是:
我试图详细描述我的方法,因此拥有较少书籍的其他人可以利用上述解决方案。但是考虑到我的要求,我在检测书籍元数据的过程中一直处于最佳状态,因此非常感谢任何指针。
答案 0 :(得分:4)
由于您不太可能每天都要检索相同的500本书:将从isbndb.com检索到的数据存储在数据库中并逐一填写。
答案 1 :(得分:4)
您可以使用他们为联盟计划公开的API,而不是抓取亚马逊:https://affiliate-program.amazon.com/gp/advertising/api/detail/main.html
它允许每小时大约3k个请求并返回格式良好的XML。它要求您设置指向您显示相关信息的图书的链接,并且您必须声明您是联属合作伙伴。
答案 2 :(得分:1)
看起来很多图书馆和其他组织通过机器可读编目又名MARC提供“ISBN”等信息,您可以找到更多相关信息{{ 3}}。
现在知道搜索“正确”的术语我发现了here。
也许这整个MARC的事情会给你一种新的想法:)
答案 3 :(得分:0)
这可能是您正在寻找的。他们甚至提供完整的下载! https://openlibrary.org/data