Yolov5调整空间金字塔池化SPPCSPC/上采样方式bilinear

这篇具有很好参考价值的文章主要介绍了Yolov5调整空间金字塔池化SPPCSPC/上采样方式bilinear。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

一、空间金字塔池化

SPP

sppcspc,python,深度学习,人工智能,cnn,计算机视觉

#   SPP结构,利用不同大小的池化核进行池化 5*5 9*9 13*13
#   先构建kernel_size=5, stride=1, padding=2的最大池化层
#   再构建kernel_size=9, stride=1, padding=4的最大池化层
#   再构建kernel_size=13, stride=1, padding=6的最大池化层
#   池化后堆叠
#---------------------------------------------------#
class SpatialPyramidPooling(nn.Module):
    def __init__(self, pool_sizes=[5, 9, 13]):
        super(SpatialPyramidPooling, self).__init__()
 
        self.maxpools = nn.ModuleList([nn.MaxPool2d(kernel_size=pool_size, stride=1, padding=pool_size//2) for pool_size in pool_sizes])
 
    def forward(self, x):
        features = [maxpool(x) for maxpool in self.maxpools[::-1]]
        features = torch.cat(features + [x], dim=1) # x指的是未经过最大池化的层
 
        return features

SPPF

sppcspc,python,深度学习,人工智能,cnn,计算机视觉

class SPPF(nn.Module):
    # Spatial Pyramid Pooling - Fast (SPPF) layer for YOLOv5 by Glenn Jocher
    def __init__(self, c1, c2, k=5):  # equivalent to SPP(k=(5, 9, 13))
        super().__init__()
        c_ = c1 // 2  # hidden channels
        self.cv1 = Conv(c1, c_, 1, 1)
        self.cv2 = Conv(c_ * 4, c2, 1, 1)
        self.m = nn.MaxPool2d(kernel_size=k, stride=1, padding=k // 2)
 
    def forward(self, x):
        x = self.cv1(x)
        with warnings.catch_warnings():
            warnings.simplefilter('ignore')  # suppress torch 1.9.0 max_pool2d() warning
            y1 = self.m(x)
            y2 = self.m(y1)
            return self.cv2(torch.cat([x, y1, y2, self.m(y2)], 1))

SPPCSPC

sppcspc,python,深度学习,人工智能,cnn,计算机视觉

class SPPCSPC(nn.Module):
    # CSP https://github.com/WongKinYiu/CrossStagePartialNetworks
    def __init__(self, c1, c2, n=1, shortcut=False, g=1, e=0.5, k=(5, 9, 13)):
        super(SPPCSPC, self).__init__()
        c_ = int(2 * c2 * e)  # hidden channels
        self.cv1 = Conv(c1, c_, 1, 1)
        self.cv2 = Conv(c1, c_, 1, 1)
        self.cv3 = Conv(c_, c_, 3, 1)
        self.cv4 = Conv(c_, c_, 1, 1)
        self.m = nn.ModuleList([nn.MaxPool2d(kernel_size=x, stride=1, padding=x // 2) for x in k])
        self.cv5 = Conv(4 * c_, c_, 1, 1)
        self.cv6 = Conv(c_, c_, 3, 1)
        self.cv7 = Conv(2 * c_, c2, 1, 1)

    def forward(self, x):
        x1 = self.cv4(self.cv3(self.cv1(x)))
        y1 = self.cv6(self.cv5(torch.cat([x1] + [m(x1) for m in self.m], 1)))
        y2 = self.cv2(x)
        return self.cv7(torch.cat((y1, y2), dim=1))

使用方式

第一步 各个代码放入common.py中

sppcspc,python,深度学习,人工智能,cnn,计算机视觉

第二步 找到yolo.py文件里的parse_model函数,将类名加入进去

sppcspc,python,深度学习,人工智能,cnn,计算机视觉



第三步 修改配置文件

sppcspc,python,深度学习,人工智能,cnn,计算机视觉

在我自己的数据集上跑了一下,发现 SPPCSPC的效果是最好的~~~

二、上采样方式

1. 最近邻插值(Nearest neighbor interpolation)

YOLOV5中默认使用的是最近邻插值‘nearest’

sppcspc,python,深度学习,人工智能,cnn,计算机视觉

 2. 双线性插值(Bi-Linear interpolation)

 若要改为双线性插值只需在yaml文件中将nearest改为bilinear,然后在后面加上True即可

sppcspc,python,深度学习,人工智能,cnn,计算机视觉

reference

空间金字塔池化改进 SPP / SPPF / ASPP / RFB / SPPCSPC_迪菲赫尔曼的博客-CSDN博客文章来源地址https://www.toymoban.com/news/detail-524802.html

到了这里,关于Yolov5调整空间金字塔池化SPPCSPC/上采样方式bilinear的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包