我用这种方式使用dask读取了csv文件:
import dask.dataframe as dd
train = dd.read_csv('act_train.csv')
然后我想在每行应用简单的逻辑,这在pandas中非常好用:
columns = list(train.columns)
for col in columns[1:]:
train[col] = train[col].apply(lambda x: x if x == -1 else x.split(' ')[1])
不幸的是,最后一行代码会产生以下错误:值的长度与索引的长度不匹配
我做错了什么?
答案 0 :(得分:0)
如果x不包含空格字符,则x.split('')将返回包含单个元素x的列表。
所以,当你试图通过调用来访问x.split('')的第二个元素时 x.split('')[1]。它会给出错误:
"值的长度与索引的长度不匹配",因为x.split中的索引1没有元素('')。