我以字符串形式用\字符(对于列)和用新行\ n字符(对于行)分隔数据。
ID\Product\quantity\n1\xx\2
看起来像Dask.array.from_array()仅支持数组作为输入。
尽管我可以使用
将上述文本转换为np.arraynp.array([i.split("\t") for i in data[1].split("\n")])
想知道是否存在将字符串直接转换为dask数组或数据帧的等效项。
答案 0 :(得分:0)
您可能需要dask.dataframe.read_csv函数
import dask.dataframe as dd
df = dd.read_csv('filename.*.csv', sep='\t')