Dask错误:值的长度与索引的长度不匹配

时间:2016-08-08 12:34:49

标签: python csv dataframe runtime-error dask

我用这种方式使用dask读取了csv文件:

import dask.dataframe  as dd
train = dd.read_csv('act_train.csv')

然后我想在每行应用简单的逻辑,这在pandas中非常好用:

columns = list(train.columns)

for col in columns[1:]:
    train[col] = train[col].apply(lambda x: x if x == -1 else x.split(' ')[1])

不幸的是,最后一行代码会产生以下错误:值的长度与索引的长度不匹配

我做错了什么?

1 个答案:

答案 0 :(得分:0)

如果x不包含空格字符,则x.split('')将返回包含单个元素x的列表。

所以,当你试图通过调用来访问x.split('')的第二个元素时 x.split('')[1]。它会给出错误:

"值的长度与索引的长度不匹配",因为x.split中的索引1没有元素('')。