我希望设计一个可以使用Google搜索引擎API检测所有格式的抄袭(基于网络)的应用程序。 我需要什么资源来申请这样的申请。 基本上,用户可以上传文件,并且将根据网络上的各种格式检查该文件。我已经读过有网络抓取工具,但我们究竟是如何使用它们的。 Google Search Appliance API是正确的方法吗?
此外我之前没有使用过Google API,那么最好的方法是什么?
非常感谢
答案 0 :(得分:1)
也许http://www.google.com/alerts会这样做?有些库可以用来进行单个查找,例如在Ruby中(乍一看)是一个galerts gem。在Python中,galerts包可以帮助您管理订阅源。其他语言可能有类似的库。之后,parse result feeds自己。