应用错误收集

使用HDF5格式将熊猫数据帧写入S3

时间：2019-09-24 02:07:52

标签： python pandas amazon-s3 hdf5

如果将S3路径（任何以s3://开头的路径）传递给熊猫的to_csv方法，它将把数据帧直接保存到S3。这不适用于to_hdf。

我是否必须使用boto3将文件保存在S3上，还是可以直接用Pandas完成？

1 个答案:

答案 0 :(得分：0)

从read_hdf允许指定S3网址，而to_hdf5不允许的角度来看，熊猫文档在这方面是不对称的。我个人的印象是，这是因为to_hdf5具有append模式（a）和S3 does not support append operations。因此，要更具体地回答您的问题，是的，一旦创建文件，您就必须使用boto3将文件导出到存储桶。有关某些策略，请参见here。

Pandas不修改默认的hdf格式
使用Pandas从Excel转换为HDF5
python数据帧写入R数据格式
是否有Pandas DataFrame实现从HDF5文件中的表中加载延迟记录？
如何在python中将大型csv文件写入hdf5？
HDF5到Dataframe格式
蟒蛇;将输出以Unix格式写入新文件
通过熊猫对HDF5格式的压缩详细信息
使用HDF5格式将熊猫数据帧写入S3
将从激光加工中收集的图像以HDF5格式转换为数据框或任何可读格式

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？