我正在使用python阅读CSV,这是代码。
train_csv = open('train.csv')
test_csv = open('test.csv')
train_data_reader = csv.DictReader(train_csv)
test_data_reader = csv.DictReader(test_csv)
row=[]
for row in train_data_reader:
X.append([int(item) for item in row[4:]])
char = row[1]
Y.append(charIntConversion(char))
train_id.append(row[0])
prediction.append(row[1])
for row in test_data_reader:
test_id.append(row[0])
test_X.append([int(item) for item in row[4:]]
当我尝试运行代码时,它显示TypeError:unhashable类型:' slice'对
X.append([int(item) for item in row[4:]])
test_X.append([int(item) for item in row[4:]]
X和test_X应包含CSV的第4列到最后一列的值。
我可能知道我的代码有什么问题,我该如何解决这个问题?
答案 0 :(得分:1)
我可以看到你已经解决了你的问题,但我想我会在这里为未来的读者留下答案。谁可能会被这个(我刚才)抓住。
问题是该对象是一个字典,并且您尝试将一个切片传递给它,该切片不可清除,因此无法用作字典键。
简单示例
>>> d = {0: 5, 1: 6, 2: 7, 3: 8, 4: 9}
>>> d[:5]
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: unhashable type: 'slice'
您要做的是从集合中获取n
项。因此,实现此目的的方法是首先将dict转换为列表(可切片)。为此,请根据您的使用情况使用dict.items
,dict.keys
或dict.values
。
dict(最近的python 3.6开发)虽然没有订购,所以你从dict.items
(或朋友)那里得到的回复可能不是对你有用的订单。因此,您可以在制作切片之前对其进行排序。
>>> sorted(d.items())[:5]
[(0, 5), (1, 6), (2, 7), (3, 8), (4, 9)]
上面的代码有点难看,但有效。
您可以使用itertools中的islice
>>> from itertools import islice
>>> list(islice(sorted(d.items()), 5))
[(0, 5), (1, 6), (2, 7), (3, 8), (4, 9)]
如果默认排序顺序不是您想要的,您可以提供一个键来排序。这种方式是低效的,因为它在切片之前对整个集合进行排序,不确定是否可以解决这个问题,或许类似于快速选择算法。
任何到达此页并对上述错误感到困惑的人都不会意识到他们正在尝试在字典上切片。在字典上执行切片并不是很有意义,大多数有经验的开发人员会意识到,如果你这样做,你就会要求一个不可预测的结果。
如果你真的想要从字典中获取前n个元素,请说明csv文件中的一行,其中列是按照规定的顺序排列的。将所需的键格式化为元组并从字典中获取这些元素会好得多。
e.g。
仅从dict中获取前两列
people = [{'name': 'paul', 'job': 'programmer', 'age': 'old'},
{'name': 'chris', 'job': 'student', 'age': 'young'}]
>>> for p in people:
... res = [p[key] for key in ('name', 'job')]
... print(res)
['paul', 'programmer']
['chris', 'student']
HTH
答案 1 :(得分:0)
# Importing the dataset
dataset = pd.read_csv('Data.csv')
X = dataset.iloc[:, 0:4].values
y = dataset.iloc[:,4].values
# Encoding categorical data
from sklearn.preprocessing import LabelEncoder, OneHotEncoder
labelencoder_X = LabelEncoder()
X[:, 3] = labelencoder_X.fit_transform(X[:, 3])
onehotencoder = OneHotEncoder(categorical_features = [3])
X = onehotencoder.fit_transform(X).toarray()