我一直在使用Ms Graph API,成功下载OneDrive的文件。
我一直在寻找一种方法,只使用Graph API读取文本内容(用于我的应用程序中的索引目的),用于不同类型的文件(pdf,xls,zip,Images等),而不是通过传统方法下载完整的文件然后使用一些"文本提取api"提取文本。然后索引文件,这将是一个耗时的任务。我知道GraphAPI有自己的搜索功能,但它缺乏像正则表达式搜索这样复杂搜索的能力(如果我错了请纠正我)。我确信OneDrive会为每个文件做自己的索引,这有助于用户进行基本搜索。
那么,有什么方法可以使用Graph API获取文档的文本内容吗?
答案 0 :(得分:1)
我不相信能够预览'目前可通过API获得基于文本的文档。您需要发出GET
请求才能获取内容。如果您不想要完整的文档,您可以request a partial range个字节,您认为该文档就足够了。此外,为了更容易处理不同的文件类型,我们目前支持converting common file formats to PDF(可能标准化您的文件解析逻辑)。