从/向镶木地板文件读取/写入pyarrow张量

时间:2017-10-17 15:57:19

标签: numpy parquet tensor pyarrow

pyarrow中,将pyarrow.Tensor(例如从numpy.ndarray创建)写入Parquet文件的建议方法是什么?是否可以不必通过pyarrow.Tablepandas.DataFrame

2 个答案:

答案 0 :(得分:3)

Parquet的数据模型是表格式的,因此张量/ ndarray必须转换为表格形式。我们没有任何内置的便利功能来帮助解决此问题,但您可以随时在问题跟踪器上发出特定的功能请求documentation

答案 1 :(得分:2)

Parquet格式针对具有嵌套数据的表进行了优化,即它期望数据表示为命名列。这与n维列的想法形成鲜明对比。对于张量,最好选择不同的格式。