如何从由制表符和换行符分隔的数据字符串创建dask数据框

时间:2019-01-22 03:25:07

标签: python dask dask-distributed dask-delayed dask-ml

我以字符串形式用\字符(对于列)和用新行\ n字符(对于行)分隔数据。

ID\Product\quantity\n1\xx\2

看起来像Dask.array.from_array()仅支持数组作为输入。

尽管我可以使用

将上述文本转换为np.array
np.array([i.split("\t") for i in data[1].split("\n")])

想知道是否存在将字符串直接转换为dask数组或数据帧的等效项。

1 个答案:

答案 0 :(得分:0)

您可能需要dask.dataframe.read_csv函数

import dask.dataframe as dd
df = dd.read_csv('filename.*.csv', sep='\t')