我有一个具有以下网络结构的pytorch模型。
from __future__ import print_function
import argparse
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
from torchvision import datasets, transforms
class lenet_mnist(nn.Module):
def __init__(self):
super(lenet_mnist, self).__init__()
self.cuda()
self.conv1 = nn.Conv2d(1, 16, kernel_size=3,padding=1)
self.relu1 = nn.ReLU(inplace=True)
self.relu2 = nn.ReLU(inplace=True)
self.relu3 = nn.ReLU(inplace=True)
self.maxpool1 = nn.MaxPool2d(kernel_size=2, stride=2)
self.maxpool2 = nn.MaxPool2d(kernel_size=2, stride=2)
self.conv2 = nn.Conv2d(16, 32, kernel_size=5,padding=2)
self.conv2_drop = nn.Dropout2d()
self.fc1 = nn.Linear(1568, 256)
self.fc2 = nn.Linear(256, 10)
def forward(self,x):
#x = x.to(torch.device("cuda:0"))
out = self.conv1(x)
out = self.maxpool1(out)
out = self.relu1(out)
out = self.conv2(out)
out = self.conv2_drop(out)
out = self.maxpool2(out)
out = self.relu2(out)
out = out.view(-1,1568)
out = self.fc1(out)
out = self.fc2(out)
return out
我训练了这个模型,并删除了模型中的几个通道,例如,将self.conv2
设置为(in=16,out=24
)。我重新加载了state_dict
模型,并为新结构修改了该模型。
现在,我正在尝试对模型进行推断,但是pytorch
仍然会拾取定义原始结构的旧model.py
文件。如何停止pytorch
寻找model.py
?
编辑:(更多信息) 为了简化模型,我只需要获取模型的state_dict,通过删除其中的几个通道来编辑张量,然后在模型上使用load_state_dict再次加载模型。我还使用更新的权重和偏差更改了model._parameters。我使用此模型来运行前向传递。运行时,出现错误,提示out.view层尺寸不匹配。并且,回溯显示pytorch正在从存在上述代码片段的model.py文件中读取模型。