我已经使用train_test_split
函数将数据分为X_train
,X_test
,y_train
,y_test
,然后使用utils.data.DataLoader
来将其输入到CNN,但问题是我不知道如何访问标签张量以创建混淆矩阵并将其与预测张量进行比较。我知道这是一个基本问题,但是无论如何,我们都会感谢您的帮助。
X_train, X_test, y_train, y_test = train_test_split(faces, emotions, test_size=0.1, random_state=42)
X_train, X_val, y_train, y_val = train_test_split(X_train, y_train, test_size=0.1, random_state=41)
我用过
train = torch.utils.data.TensorDataset(torch.from_numpy(X_train), torch.from_numpy(y_train))
train_loader = torch.utils.data.DataLoader(train, batch_size=100, shuffle=True)
用于将数据提供给我的网络 看来您可以通过在{_1}之类的train_set后面键入目标属性来访问标签,但这种方式不适用于我。如何获得标签?
答案 0 :(得分:0)
PyTorch的DataLoader对象大致是这样使用的:
for i, (inputs, labels) in enumerate(dataloader):
inputs = inputs.to(device)
labels = labels.to(device)
outputs = model(inputs)
_, preds = torch.max(outputs, 1)
通常,我建议使用两个DataLoader,一个用于培训,另一个用于测试/验证。由于您要创建一个混淆矩阵,因此您可以简单地通过numpy数组y_train
和预测preds
来访问标签,例如通过将它们在循环内连接到一个numpy数组。
有关如何使用DataLoader的更多信息,我建议看一下这个非常好的教程: https://pytorch.org/tutorials/beginner/blitz/cifar10_tutorial.html#sphx-glr-beginner-blitz-cifar10-tutorial-py
和
https://pytorch.org/tutorials/beginner/data_loading_tutorial.html