Python Vaex如何从CSV文件创建数据框?

时间:2020-01-14 17:26:02

标签: python dataframe vaex

为什么我只得到最后一列

if __name__ == '__main__':
# win远程linux运行
import vaex,pandas as pd
df_pd = pd.read_csv('./a.csv')  # contains 4 columns
print(df_pd)
print(list(df_pd.columns))
df = vaex.from_pandas(df_pd)   # only last column   # why???
print(df)

为什么我只得到最后一列

2 个答案:

答案 0 :(得分:1)

Vaex用下划线替换非ASCII字符,但是两个下划线表示“隐藏”列。我们应该改变它,为此我打开了一个问题: https://github.com/vaexio/vaex/issues/558

答案 1 :(得分:0)

要从csv文件中创建vaex数据框。

尝试vaex.from_csv('a.csv')

如果数据集庞大且包含数十亿个数据,则可能必须在from_csv中使用chunk_size以避免内存问题。