我们可以使用nutch和solr抓取和索引Google云端硬盘文档吗?

时间:2015-06-01 08:54:28

标签: solr google-drive-api nutch moss2007enterprisesearch

我尝试过对google驱动器文档的公共网址编制索引,但它似乎无法正常工作。有没有办法通过nutch抓取google驱动器文档并使用solr制作索引?

1 个答案:

答案 0 :(得分:2)

使用Google Drive API读取/管理文件

https://developers.google.com/drive/web/about-sdk

云端硬盘公共网址的页面没有指向子目录的直接链接,因此如果您抓取这些网页,您将无法获得任何内容。