标签: java google-drive-api
我正在使用google drive api来存储和检索pdf文件。我想使用搜索参数查询这些文件。
但在我开始实施之前。我想知道谷歌如何处理大型PDF文件的索引。 (600 +页25Mb +)我想知道基于文本的pdf。(他们不需要ocr)
我在驱动器网站上尝试了一些搜索,但并不总是有效。
我想知道是否有任何限制以及它们是什么。
答案 0 :(得分:3)
根据this page对于带有OCR的PDF:
图像(.jpg,.gif,.png)和PDF文件(.pdf)的最大大小为2 MB。对于PDF文件,我们只查看搜索要提取的文本时的前10页。
this page适用于带文字的PDF:
您可以通过以下方式搜索PDF和图像文件中的文本:
理论上,您应该能够搜索您上传的任何文本文档或基于文本的PDF的前100页。您还可以搜索驱动器上任何图像PDF的前十页中找到的文本。