我正在尝试从NASA的.hdf格式TRMM数据中,以3h时间步长为研究区域创建一个降水时间序列。我了解我需要使用OPENDAP(如下所示的示例网址)来访问完整的数据集。我已经成功找到了数据,但是有数百个文件,根据天/月/年,每个文件都位于不同的文件夹中。对于每个文件,我需要一个值(一个像素)。网址示例如下:
其中文件路径由数据类型(/TRMM_L3/TRMM_3B42.7),年份(/ 2018),一年中的某天(365中的/ 146)以及一天中的3小时周期确定( 3B42.20180526.03.7.HDF,这里是'.03。'所示的03:00。每天有8种选择:03、06、09、12、15、18、21、00)
首先,是否有人对我如何访问所有相关文件有任何建议?接下来,我需要提取研究区域的值,该值恰好被一个TRMM像素覆盖,该行的lat / long行号为lat = 267和long =471。关于如何隔离我是否有想法?并从每个文件中提取该单个值,然后将它们全部放入按日期/时间索引的一个数据帧中?
我收集到我将需要使用一个for循环来遍历每个文件,但是我不确定应该如何编写代码(如果不是很明显,我是Python的新手)。
任何建议都非常感谢,非常感谢!