从谷歌驱动器获取HTML文档

时间:2013-09-23 17:49:57

标签: python google-drive-api

我已对用户进行了身份验证,并且我可以访问该特定用户的Drive API Service Instance。使用下面的方法,我可以访问所有文件:

def retrieve_all_files(service):
    """Retrieve a list of File resources.

    Args:
    service: Drive API service instance.
    Returns:
    List of File resources.
    """

    result = []
    page_token = None

    while True:
        try:
            param = {}
            if page_token:
                param['pageToken'] = page_token
            files = service.files().list(**param).execute()

            result.extend(files['items'])
            page_token = files.get('nextPageToken')
            if not page_token:
                break
        except errors.HttpError, error:
            print 'An error occurred: %s' % error
            break

    return result

现在,我想要的是,对于每个文件,我想下载HTML版本。请注意,我只对HTML文件感兴趣。如何通过API生成HTML zip文件的链接?

1 个答案:

答案 0 :(得分:1)

您应该遍历result,这是file个对象的列表(实际上,这些是字典)。

这些对象中的每一个都将具有exportLinks属性,这是一个字典本身。在那里寻找一个text/html密钥(请注意,它可能不存在,这表明您无法将此文件检索为HTML)。

这是您可以将文件检索为HTML导出的URL。


详细参考文献记录在此处:https://developers.google.com/drive/v2/reference/files#resource