使用Pandas从python中的S3读取.h5文件时出现FileNotFoundError

时间:2019-12-17 23:52:11

标签: python pandas amazon-s3 boto3 hdf5

由于某种原因,当我尝试使用pandas.read_hdf()方法从S3读取hdf文件时,在放置s3网址时出现FileNotFoundError。该文件肯定存在,并且我尝试将pandas.read_csv()方法与同一s3目录中的csv文件一起使用,并且可以正常工作。还有什么我需要做的吗?这是代码:

import boto3
import h5py
import s3fs
import pandas as pd

csvDataframe = pd.read_csv('s3://BUCKET_NAME/FILE_NAME.csv', key='df')
print("Csv data:")
print(csvDataframe)
dataframe = pd.read_hdf('s3://BUCKET_NAME/FILE_NAME.h5', key='df')
print("Hdf data:")
print(dataframe)

这是错误:

FileNotFoundError: File s3://BUCKET_NAME/FILE_NAME.h5 does not exist

在实际代码中,BUCKET_NAME和FILE_NAME被替换为其实际字符串。

1 个答案:

答案 0 :(得分:0)

请确保文件扩展名为.h5