由于某种原因,当我尝试使用pandas.read_hdf()方法从S3读取hdf文件时,在放置s3网址时出现FileNotFoundError。该文件肯定存在,并且我尝试将pandas.read_csv()方法与同一s3目录中的csv文件一起使用,并且可以正常工作。还有什么我需要做的吗?这是代码:
import boto3
import h5py
import s3fs
import pandas as pd
csvDataframe = pd.read_csv('s3://BUCKET_NAME/FILE_NAME.csv', key='df')
print("Csv data:")
print(csvDataframe)
dataframe = pd.read_hdf('s3://BUCKET_NAME/FILE_NAME.h5', key='df')
print("Hdf data:")
print(dataframe)
这是错误:
FileNotFoundError: File s3://BUCKET_NAME/FILE_NAME.h5 does not exist
在实际代码中,BUCKET_NAME和FILE_NAME被替换为其实际字符串。
答案 0 :(得分:0)
请确保文件扩展名为.h5