pytorch利用resnet50实现cifar10准确率到95%以上

目录前言代码前言因为课程需要，老师要求使用resnet18或者resnet50将cifar10训练到精度到达95%，试过了网上其他很多方法，发现精度最高的是在预处理化的时候，图片resize到32,32，并且padding=4进行填充，并且优化器用SGD，准确率最高，但是准确率最高也是到88.8%。后来和上课的同学讨论，发现先将图片resize到(224,224)再进行翻转等操作可以稳定实现超过9

暮尘依旧

17887人浏览 · 2021-08-14 13:24:14

暮尘依旧 · 2021-08-14 13:24:14 发布

前言

因为课程需要，老师要求使用resnet18或者resnet50将cifar10训练到精度到达95%，试过了网上其他很多方法，发现精度最高的是在预处理化的时候，图片resize到32,32，并且padding=4进行填充，并且优化器用SGD，准确率最高，但是准确率最高也是到88.8%。后来和上课的同学讨论，发现先将图片resize到(224,224)再进行翻转等操作可以稳定实现超过95%的准确率。大概训练4-5个epoch就可以了。
注：进行了迁移学习，加载了预训练模型

代码

废话不多说，直接上代码
注：因为CPU训练速度太慢了，尤其是将图片拉到224,224这么大，故最好使用GPU训练。并且使用了tensorboard将损失给画了出来

import torch
from torch.utils.tensorboard.summary import image
import torchvision
import torch.nn.functional as F
import torch.nn as nn
import torchvision.transforms as transforms
import torch.optim as optim


from torch.utils.tensorboard import SummaryWriter
myWriter = SummaryWriter('./tensorboard/log/')



myTransforms = transforms.Compose([
    transforms.Resize((224, 224)),
    transforms.RandomHorizontalFlip(p=0.5),
    transforms.ToTensor(),
    transforms.Normalize((0.485, 0.456, 0.406), (0.229, 0.224, 0.225))])


#  load
train_dataset = torchvision.datasets.CIFAR10(root='./cifar-10-python/', train=True, download=True, transform=myTransforms)
train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=64, shuffle=True, num_workers=0)

test_dataset = torchvision.datasets.CIFAR10(root='./cifar-10-python/', train=False, download=True, transform=myTransforms)
test_loader = torch.utils.data.DataLoader(test_dataset, batch_size=4, shuffle=True, num_workers=0)



# 定义模型
myModel = torchvision.models.resnet50(pretrained=True)
# 将原来的ResNet18的最后两层全连接层拿掉,替换成一个输出单元为10的全连接层
inchannel = myModel.fc.in_features
myModel.fc = nn.Linear(inchannel, 10)

# 损失函数及优化器
# GPU加速
myDevice = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
myModel = myModel.to(myDevice)


learning_rate=0.001
myOptimzier = optim.SGD(myModel.parameters(), lr = learning_rate, momentum=0.9)
myLoss = torch.nn.CrossEntropyLoss()

for _epoch in range(10):
    training_loss = 0.0
    for _step, input_data in enumerate(train_loader):
        image, label = input_data[0].to(myDevice), input_data[1].to(myDevice)   # GPU加速
        predict_label = myModel.forward(image)
       
        loss = myLoss(predict_label, label)

        myWriter.add_scalar('training loss', loss, global_step = _epoch*len(train_loader) + _step)

        myOptimzier.zero_grad()
        loss.backward()
        myOptimzier.step()

        training_loss = training_loss + loss.item()
        if _step % 10 == 0 :
            print('[iteration - %3d] training loss: %.3f' % (_epoch*len(train_loader) + _step, training_loss/10))
            training_loss = 0.0
            print()
    correct = 0
    total = 0
    #torch.save(myModel, 'Resnet50_Own.pkl') # 保存整个模型
    myModel.eval()
    for images,labels in test_loader:
        # GPU加速
        images = images.to(myDevice)
        labels = labels.to(myDevice)     
        outputs = myModel(images)   # 在非训练的时候是需要加的，没有这句代码，一些网络层的值会发生变动，不会固定
        numbers,predicted = torch.max(outputs.data,1)
        total += labels.size(0)
        correct += (predicted==labels).sum().item()

    print('Testing Accuracy : %.3f %%' % ( 100 * correct / total))
    myWriter.add_scalar('test_Accuracy',100 * correct / total)