语义分割学习笔记(二)转置卷积

这篇具有很好参考价值的文章主要介绍了语义分割学习笔记(二)转置卷积。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

目录

1.转置卷积Transposed Convolution概念

2.转置卷积操作步骤

3.转置卷积参数

4.实战案例


推荐课程:转置卷积(transposed convolution)_哔哩哔哩_bilibili

感谢霹雳吧啦Wz,真乃神人也。

1.转置卷积Transposed Convolution概念

转置卷积的作用:转置卷积是上采样方法中的一种, 通常,对图像进行多次卷积运算后,特征图的尺寸会不断缩小。而对于某些特定任务 (如图像分割和图像生成等),需将图像恢复到原尺寸再操作,这时就需要通过上采样操作将图像恢复到原尺寸大小。

2.转置卷积操作步骤

转置卷积/反卷积

 注:转置卷积不是卷积的逆运算,转置卷积也是卷积。

当填充为p,步幅为s时:

1.在输入特征图元素的行和列之间插入s-1行和列的0。

2.将输入特征图元素填充k-p-1行和列的0(k是核窗口大小)

3.将核矩阵上下、左右翻转

4.然后做正常卷积(填充=0,步幅=1)

输入的高(宽)为h,核为k,填充为p,步幅为s则转置卷积后h‘ = hs + k - 2p - s

语义分割学习笔记(二)转置卷积

例:当填充=1,步幅=2

语义分割学习笔记(二)转置卷积

3.转置卷积参数

torch.nn.ConvTranspose2d(in_channels, out_channels, kernel_size, stride=1, padding=0, groups=1, bias=True, dilation=1)

  • in_channels (int) – 输入通道数

  • out_channels (int) – 输出通道数

  • kernel_size (int or tuple) – 卷积核大小

  • stride (int or tuple, optional) – 步幅。 默认为 1

  • padding (int or tuple, optional) – 填充。 默认为 0

  • output_padding (int or tuple, optional) – 额外的填充在输出。 默认为 0

  • groups (int, optional) – 是否使用组卷积。 默认为 1

  • bias (bool, optional) – 是否在输出上添加偏执. 默认为 True

  • dilation (int or tuple, optional) – 是否使用膨胀卷积、空洞卷积。 默认为 1

 

4.实战案例

pytorch官方案例:

import torch
from torch import nn

input = torch.randn(1, 16, 12, 12)

print("输入形状大小:",input.size())
# 下采样
downsample = nn.Conv2d(16, 16, 3, stride=2, padding=1)
# 上采样
upsample = nn.ConvTranspose2d(16, 16, 3, stride=2, padding=1)

# 先下采样
h = downsample(input)
print("经过3x3的下采样后,形状大小:",h.size())

# 再上采样
output = upsample(h, output_size=input.size())
print("经过3x3的转置卷积后,形状大小:",output.size())

输出文章来源地址https://www.toymoban.com/news/detail-428802.html

输入形状大小: torch.Size([1, 16, 12, 12])
经过3x3的下采样后,形状大小: torch.Size([1, 16, 6, 6])
经过3x3的转置卷积后,形状大小: torch.Size([1, 16, 12, 12])

到了这里,关于语义分割学习笔记(二)转置卷积的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 卷积神经网络(CNN):基于PyTorch的遥感影像、无人机影像的地物分类、目标检测、语义分割和点云分类

    我国高分辨率对地观测系统重大专项已全面启动,高空间、高光谱、高时间分辨率和宽地面覆盖于一体的全球天空地一体化立体对地观测网逐步形成,将成为保障国家安全的基础性和战略性资源。随着小卫星星座的普及,对地观测已具备多次以上的全球覆盖能力,遥感影像也

    2024年02月04日
    浏览(53)
  • 实时语义分割---PIDNet论文笔记

    PIDNet是2023年发表在CVPR上的实时语义分割网络,在推理速度和准确性之间实现了最佳平衡,其中该系列的PIDNet-S在Cityscapes 测试集上达到93.2 FPS + 78.6% mIOU。 论文和开源代码在这里。 解决的问题:传统双分支网络低层的细节信息和高层语义信息直接融合,会导致细节特征很容易

    2023年04月08日
    浏览(35)
  • YOLOV7语义分割(日后自用笔记)

    系统win10。本文只是根据readme文件走流程,记录一些常用公式。 RizwanMunawar/yolov7-segmentation at 87b016cda50371d6e2824378d641c2d4417ea1c3 (github.com) 目录 一、项目文件的下载与直接运用 1.将工程文件git到本地 2.创建并配置虚拟环境,记录常用公式 3.下载权重文件进行训练后结果测试  二、

    2024年02月07日
    浏览(73)
  • 语义分割学习篇

    part1 什么是语义分割? 语义分割使图像分类任务的一种,实际上是对图片中每个像素进行分类,将相同类别的像素聚在一起从而呈现出分割的效果。 主要应用于 无人驾驶 (以像素粒度感知周围环境)与 医疗影像 领域(以像素粒度定位病灶区域) 当物体存在遮挡时,语义分

    2024年02月12日
    浏览(32)
  • [论文笔记] Swin UNETR 论文笔记: MRI 图像脑肿瘤语义分割

    Author: Sijin Yu [1] Ali Hatamizadeh, Vishwesh Nath, Yucheng Tang, Dong Yang, Holger R. Roth, and Daguang Xu. Swin UNETR: Swin Transformers for Semantic Segmentation of Brain Tumors in MRI Images . MICCAI, 2022. 📎开源代码链接 脑肿瘤的语义分割是一项基本的医学影像分析任务, 涉及多种 MRI 成像模态, 可协助临床医生诊断病

    2024年04月14日
    浏览(69)
  • 深度学习中语义分割、实例分割、目标检测和图像分类区别

    语义分割 实例分割 目标检测 语义分割:需要判断每个像素属于哪一个类别,属于像素级别分类标注 实例分割:相较于语义分割 会将同一类别的不同物体进行分离标注   目标检测:输入图像通常包含多个物体,对物体的位置与类别进行标注  图像分类:输入图像通常包含一

    2024年02月08日
    浏览(54)
  • 自动驾驶预测-决策-规划-控制学习(5):图像分割与语义分割入门

    提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 对于图像的分析,传统的检测任务,比如这幅图的人,用标注框来表示。 而图像分割,则是针对每一个像素都可以被认定为不同的语义信息,比如这里红色区域的像素点属于人,蓝色属于天空,浅绿色

    2024年01月18日
    浏览(44)
  • 深度学习语义分割篇——FCN源码解析篇

    🍊作者简介:秃头小苏,致力于用最通俗的语言描述问题 🍊往期回顾:深度学习语义分割篇——FCN原理详解篇 🍊近期目标:写好专栏的每一篇文章 🍊支持小苏:点赞👍🏼、收藏⭐、留言📩   ​  本篇文章参考霹雳吧啦Wz在B站上的视频进行讲解,点击☞☞☞下载FCN源

    2024年02月07日
    浏览(44)
  • AI实战营第二期 第七节 《语义分割与MMSegmentation》——笔记8

    MMSegmentation 是一个基于 PyTorch 的语义分割开源工具箱。它是 OpenMMLab 项目的一部分。 main 分支代码目前支持 PyTorch 1.6 以上的版本。 代码链接:https://gitee.com/open-mmlab/mmsegmentation 统一的基准平台。我们将各种各样的语义分割算法集成到了一个统一的工具箱,进行基准测试。 模块

    2024年02月08日
    浏览(39)
  • 【深度学习实战(6)】搭建通用的语义分割推理流程

    无论输入的图片尺寸多大,都会经过letter_box后,变为512x512尺寸 21个channel代表(20+1)个类别,512x512为模型输入及输入尺寸 经过softmax后,512x512的mask图中,每个位置(x,y)对应的21个channel的值和为1。 pr类型是np,array,所以可以通过这种方式进行逆letter_box操作,将mask的宽高,还原

    2024年04月16日
    浏览(38)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包