我正在读取一个实木复合地板文件并将其转换为数据帧。
from fastparquet import ParquetFile
pf = ParquetFile('file.parquet')
df = pf.to_pandas()
是否可以从变量(以前读取并现在保存镶木地板数据)中读取镶木地板文件?
谢谢。
答案 0 :(得分:0)
在熊猫中,有处理镶木地板的方法。 Here是对文档的引用。像这样:
import pandas as pd
pd.read_parquet('file.parquet')
应该工作。另外,请阅读this帖子以选择引擎。
答案 1 :(得分:0)
您还可以使用pandas.read_parquet
使用以下代码从变量读取文件。我使用pyarrow
后端对此进行了测试,但这也适用于fastparquet
后端。
import pandas as pd
import io
with open("file.parquet", "rb") as f:
data = f.read()
buf = io.BytesIO(data)
df = pd.read_parquet(buf)