检索存储在Google相册中的视频的文件大小

时间:2019-05-08 17:58:09

标签: python http-headers video-streaming google-photos google-photos-api

上下文:我想看看我如何使用Google Photos空间,我用Python编写了一个小脚本,该脚本使用Google Photos API检索了我所有的相册及其内容(使用{ {3}})。文件信息不存在,但是使用mediaItem baseUrl(记录在https://developers.google.com/photos/library/reference/rest/v1/mediaItems/search中),我可以执行一个HEAD请求,并从标题中获取content-length。这对于照片来说似乎很好用,但是视频的大小被大大低估了。我的猜测是Google相册已准备好流式传输视频,并且不会发送完整的视频信息。

问题:是否可以通过某种方式检索存储在Google相册中的视频的文件大小,而不必下载整个视频?该应用程序确实知道文件的大小,但是API中似乎没有该文件的大小。有什么方法可以发送一些请求标头来获取文件大小?

其他信息::我正在使用Python和httplib2.Http()来处理HEAD请求(很高兴使用请求模块或任何其他替代方法)。

这是从API中检索到的信息,该视频文件略大于100MB(绝对不是30k):

{
  "id": "XYZ",
  "productUrl": "https://photos.google.com/lr/photo/XYZ",
  "baseUrl": "https://lh3.googleusercontent.com/lr/ABC",
  "mimeType": "video/mp4",
  "mediaMetadata": {
    "creationTime": "2018-11-27T03:43:27Z",
    "width": "1920",
    "height": "1080",
    "video": {
      "fps": 120,
      "status": "READY"
    }
  },
  "filename": "VID_20181126_174327.mp4"
}

这些是从HEAD请求发送到baseUrl的标头:

{
  "access-control-expose-headers": "Content-Length",
  "etag": "\"v15ceb\"",
  "expires": "Fri, 01 Jan 1990 00:00:00 GMT",
  "cache-control": "private, max-age=86400, no-transform",
  "content-disposition": "inline;filename=\"VID_20181126_174327.jpg\"",
  "content-type": "image/jpeg",
  "vary": "Origin",
  "x-content-type-options": "nosniff",
  "date": "Wed, 08 May 2019 17:39:42 GMT",
  "server": "fife",
  "content-length": "31652",
  "x-xss-protection": "0",
  "alt-svc": "quic=\":443\"; ma=2592000; v=\"46,44,43,39\"",
  "status": "200",
  "content-location": "https://lh3.googleusercontent.com/lr/ABC"
}

谢谢。

2 个答案:

答案 0 :(得分:0)

这是来自OP的错误语言,但我认为翻译成Python cURL call是一项简单的任务。

我成功使用了以下功能,通过调用文件baseUrl来检索Google Photos图像和视频文件的大小,如从API检索的一样:

function retrieve_remote_file_size($url){
     $ch = curl_init($url);

     curl_setopt($ch, CURLOPT_RETURNTRANSFER, TRUE);
     curl_setopt($ch, CURLOPT_HEADER, TRUE);
     curl_setopt($ch, CURLOPT_NOBODY, TRUE);

     $data = curl_exec($ch);
     $size = curl_getinfo($ch, CURLINFO_CONTENT_LENGTH_DOWNLOAD);

     curl_close($ch);
     return $size;
}

Source

请注意(与上述baseUrl链接中的“警告” 相反),我不需要不需要在其中指定宽度/高度或下载参数baseUrl才能使用此功能。

答案 1 :(得分:0)

Photos API docs 提到对于视频,API 返回的 baseUrl 指的是视频的缩略图而不是视频本身,您必须将 =dv 附加到baseUrl 以实际接收视频。从我的实验来看,从该端点返回的 content-length 也是准确的:

import requests

baseUrl = "https://lh3.googleusercontent.com/lr/AF..."
# just the thumbnail's size
requests.head(baseUrl,allow_redirects=True).headers['content-length']
# the entire video's size
requests.head(baseUrl + "=dv",allow_redirects=True).headers['content-length']