应用错误收集

使用pyarrow在Amazon S3上打开实木复合地板文件时出错

时间：2018-08-28 12:29:35

标签： python amazon-s3 parquet pyarrow

我有这段代码，应该从存储在S3上的实木复合地板文件中读取单列数据： fs = s3fs.S3FileSystem() data_set = pq.ParquetDataset(f"s3://{bucket}/{key}", filesystem=fs) column_data = data_set.read(columns=[col_name])

我得到了这个例外： validate_schemas self.schema = self.pieces [0] .get_metadata（open_file）.schema IndexError：列表索引超出范围

我升级到了最新版本的pyarrow，但没有帮助

0 个答案:

没有答案

使用AWS Lambda读取存储在S3中的Parquet文件（Python 3）
如何使用pyarrow流式传输镶木地板？
S3上的Parquet文件格式：实际的Parquet文件是什么？
使用pyarrow在Amazon S3上打开实木复合地板文件时出错
在S3中用pyarrow覆盖镶木地板文件
如何使用熊猫编写分区的Parquet文件
Apache-Drill查询镶木地板文件：镶木地板记录读取器中的错误
改善实木复合地板文件中重写时间戳的性能
如何使用pyarrow.RecordBatchStreamWriter编写压缩的实木复合地板文件？
如何使用pyarrow从s3中读取分区的实木复合地板文件？

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？