Google Earth Engine下载问题,这是由不变的服务器端对象引起的吗?

时间:2020-03-24 12:11:43

标签: google-earth-engine

我有一个功能,可以将图像集下载为TFrecord或Geotiff。

在此使用功能-

def download_image_collection_to_drive(collection, aois, bands, limit, export_format):
    if collection.size().lt(ee.Number(limit)):
        bands = [band for band in bands if band not in ['SCL', 'QA60']]
        for aoi in aois:
            cluster = aoi.get('cluster').getInfo()
            geom = aoi.bounds().getInfo()['geometry']['coordinates']
            aoi_collection = collection.filterMetadata('cluster', 'equals', cluster)

            for ts in range(1, 11):
                print(ts)
                ts_collection = aoi_collection.filterMetadata('interval', 'equals', ts)
                if ts_collection.size().eq(ee.Number(1)):
                    image = ts_collection.first()
                    p_id = image.get("PRODUCT_ID").getInfo()
                    description = f'{cluster}_{ts}_{p_id}'
                    task_config = {
                        'fileFormat': export_format,
                        'image': image.select(bands),
                        'region': geom,
                        'description': description,
                        'scale': 10,
                        'folder': 'output'
                    }
                    if export_format == 'TFRecord':
                        task_config['formatOptions'] = {'patchDimensions': [256, 256], 'kernelSize': [3, 3]}
                    task = ee.batch.Export.image.toDrive(**task_config)
                    task.start()
                else:
                    logger.warning(f'no image for interval {ts}')
    else:
        logger.warning(f'collection over {limit} aborting drive download')

似乎每到第二次aoi都会失败,我对此感到困惑,因为if ts_collection.size().eq(ee.Number(1))确认那里有一个图像,因此它应该设法从中获取产品ID。

line 24, in download_image_collection_to_drive
    p_id = image.get("PRODUCT_ID").getInfo()
  File "/lib/python3.7/site-packages/ee/computedobject.py", line 95, in getInfo
    return data.computeValue(self)
  File "/lib/python3.7/site-packages/ee/data.py", line 717, in computeValue
    prettyPrint=False))['result']
  File "/lib/python3.7/site-packages/ee/data.py", line 340, in _execute_cloud_call
    raise _translate_cloud_exception(e)
ee.ee_exception.EEException: Element.get: Parameter 'object' is required.

我在某处会碰到不可变的服务器端对象吗?

1 个答案:

答案 0 :(得分:1)

这是服务器端的值,是的,是的,但是不变性与它无关—您的if语句无法按预期工作。

ts_collection.size().eq(ee.Number(1))是服务器端的值-您已经描述了尚未发生的比较。这意味着执行任何类似Python if语句的本地操作都不能考虑比较结果,而只会将其视为真实值。

使用getInfo是一个快速解决方案:

if ts_collection.size().eq(ee.Number(1)).getInfo():

但是通过一次只提取整个集合的信息(包括图像信息)来避免过多使用getInfo会更有效。

...
ts_collection_info = ts_collection.getInfo()
if ts_collection['features']:  # Are there any images in the collection?
    image = ts_collection.first()
    image_info = ts_collection['features'][0]  # client-side image info already downloaded
    p_id = image_info['properties']['PRODUCT_ID']  # get ID from client-side info
    ...

通过这种方式,您每个ts只会发出两个请求:一个用于检查是否匹配,另一个用于开始导出。

请注意,我实际上并未运行此Python代码,可能会有一些小错误;如果它给您带来麻烦,请print(ts_collection_info)并检查您实际收到的结构以弄清楚如何解释它。