计算机视觉与图形学-神经渲染专题-pi-GAN and CIPS-3D

这篇具有很好参考价值的文章主要介绍了计算机视觉与图形学-神经渲染专题-pi-GAN and CIPS-3D。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

《pi-GAN: Periodic Implicit Generative Adversarial Networks for 3D-Aware Image Synthesis

摘要

我们见证了3D感知图像合成的快速进展,利用了生成视觉模型和神经渲染的最新进展。然而,现有的方法在两方面存在不足:首先,它们可能缺乏底层的3D表示,或者依赖于视图不一致的渲染,从而合成不具有多视图一致性的图像;其次,它们往往依赖于表达能力不足的表示网络架构,因此它们的结果缺乏图像质量。我们提出了一种新的生成模型,称为周期隐式生成对抗性网络(π-GAN或π-GAN),用于高质量的3D感知图像合成。π-GAN利用具有周期激活函数和体积渲染的神经表示来将场景表示为视图一致的辐射场。所提出的方法在具有多个真实和合成数据集的3D感知图像合成中获得了最先进的结果。

实验效果

计算机视觉与图形学-神经渲染专题-pi-GAN and CIPS-3D,计算机视觉,生成对抗网络,3d,人工智能,神经网络

框架

pi-GAN的生成框架,

计算机视觉与图形学-神经渲染专题-pi-GAN and CIPS-3D,计算机视觉,生成对抗网络,3d,人工智能,神经网络

地址:https://arxiv.org/pdf/2012.00926v2.pdf

《CIPS-3D: A 3D-Aware Generator of GANs Based on Conditionally-Independent Pixel Synthesis》

摘要

基于风格的GAN(StyleGAN)架构在生成高质量图像方面取得了最先进的成果,但它缺乏对相机姿势的明确和精确控制。最近提出的基于NeRF的GANs在3D感知生成器方面取得了巨大进展,但它们还无法生成高质量的图像。本文介绍了CIPS-3D,这是一种基于风格的3D感知生成器,由浅NeRF网络和深隐式神经表示(INR)网络组成。生成器在没有任何空间卷积或上采样操作的情况下独立地合成每个像素值。此外,我们诊断了镜像对称问题,这意味着次优解,并通过引入辅助鉴别器来解决它。CIPS3D经过对原始单视图图像的训练,在FFHQ上256×256分辨率的图像中,其令人印象深刻的FID为6.97,创下了3D感知图像合成的新纪录。我们还展示了CIPS-3D的几个有趣的方向,如迁移学习和3D人脸风格化。

框架

基于风格的 3D 感知生成器的详细超参数介绍。NeRF 网络很浅,以节省运行时内存。INR网络很深,以增加生成器的容量。我们将3D 形状和外观分开,其中 NeRF 网络负责 3D 形状,INR 网络负责外观。辅助鉴别器有助于克服镜像对称问题。对于 INR 网络,每个 ModFC 后面都跟着一个 LeakyReLU(此处未显示)。

计算机视觉与图形学-神经渲染专题-pi-GAN and CIPS-3D,计算机视觉,生成对抗网络,3d,人工智能,神经网络

实验结

计算机视觉与图形学-神经渲染专题-pi-GAN and CIPS-3D,计算机视觉,生成对抗网络,3d,人工智能,神经网络

结论

本文提出了一种基于风格的 3D 感知生成器,可以独立合成像素值,无需任何空间卷积或上采样操作。我们发现输入坐标的对称性导致了镜像对称问题,并提出利用辅助鉴别器来解决这个问题。我们期待将所提出的生成器应用于更有趣的应用,例如 3D 感知 GAN 反转和图像到图像翻译。

论文地址:https://arxiv.org/pdf/2110.09788v1.pdf文章来源地址https://www.toymoban.com/news/detail-625906.html

到了这里,关于计算机视觉与图形学-神经渲染专题-pi-GAN and CIPS-3D的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 计算机视觉: 神经网络的视觉世界

    计算机视觉是人工智能领域的一个重要分支,它涉及到计算机如何理解和处理图像和视频。随着深度学习技术的发展,神经网络已经成为计算机视觉的主要工具。在这篇文章中,我们将讨论计算机视觉的基本概念、核心算法和应用。 计算机视觉的主要任务包括图像分类、目标

    2024年02月21日
    浏览(42)
  • 计算机视觉-卷积神经网络

    目录 计算机视觉的发展历程 卷积神经网络 卷积(Convolution) 卷积计算 感受野(Receptive Field) 步幅(stride) 感受野(Receptive Field) 多输入通道、多输出通道和批量操作 卷积算子应用举例 计算机视觉作为一门让机器学会如何去“看”的学科,具体的说,就是让机器去识别摄

    2024年02月10日
    浏览(40)
  • 7.卷积神经网络与计算机视觉

    计算机视觉是一门研究如何使计算机识别图片的学科,也是深度学习的主要应用领域之一。 在众多深度模型中,卷积神经网络“独领风骚”,已经被称为计算机视觉的主要研究根据之一。 卷积神经网络最初由 Yann LeCun(杨立昆)等人在1989年提出,是最初取得成功的深度神经

    2024年04月10日
    浏览(73)
  • 计算机视觉 图像形成 几何图形和变换 3D到2D投影

            现在我们知道如何表示2D和3D几何图元以及如何在空间上转换它们,我们需要指定如何将 3D图元投影到图像平面上。 我们可以使用线性3D到2D投影矩阵来做到这一点。最简单的模型是正交法,它不需要除法就可以得到最终的(不均匀的)结果。更常用的模型是透视,

    2023年04月08日
    浏览(57)
  • 计算机视觉:深层卷积神经网络的构建

    上一节课程中我们学习了单卷积层的前向传播,本次课程我们构建一个具有三个卷积层的卷积神经网络,然后从输入(39*39*3)开始进行三次卷积操作,我们来看一下每次卷积的输入和输出维度的变化。 第一层使用3*3*3的过滤器来提取特征,那么f[1]=3,然后步长s[1]=1,填充p[1]

    2024年02月10日
    浏览(48)
  • 【深度学习】计算机视觉(五)——卷积神经网络详解

    卷积神经网络(CNN) 卷积神经网络基本上应用于图像数据。假设我们有一个输入的大小(28 * 28 * 3),如果我们使用正常的神经网络,将有2352(28 * 28 * 3)参数。并且随着图像的大小增加参数的数量变得非常大。我们“卷积”图像以减少参数数量。 CNN的输入和输出没什么特别

    2024年02月06日
    浏览(54)
  • 【计算机视觉】万字长文详解:卷积神经网络

    以下部分文字资料整合于网络,本文仅供自己学习用! 如果输入层和隐藏层和之前一样都是采用全连接网络,参数过多会导致 过拟合 问题,其次这么多的参数存储下来对计算机的内存要求也是很高的 解决这一问题,就需要用到——卷积神经网络 这是一种理解卷积的角度(

    2024年02月19日
    浏览(55)
  • 神经网络在计算机视觉中的主要技术

    计算机视觉是一种通过计算机程序对图像进行处理和分析的技术。在过去几十年中,计算机视觉技术发展迅速,成为了一种重要的技术手段,应用于各个领域。随着深度学习技术的发展,神经网络在计算机视觉领域的应用也越来越广泛。本文将从以下几个方面进行阐述: 背景

    2024年02月21日
    浏览(43)
  • 再见卷积神经网络,使用 Transformers 创建计算机视觉模型

    本文旨在介绍 / 更新 Transformers 背后的主要思想,并介绍在计算机视觉应用中使用这些模型的最新进展。 读完这篇文章,你会知道…… 为什么 Transformers 在 NLP 任务中的表现优于 SOTA 模型。 Transformer 模型的工作原理 这是卷积模型的主要限制。 Transformers 如何克服卷积模型的限

    2024年02月02日
    浏览(45)
  • 计算机视觉基础知识(十二)--神经网络与深度学习

    一种机器学习的算法 一般有输入层--隐藏层--输出层 隐藏层数量多于两个的称为深度神经网络; 输入的是特征向量; 特征向量代表的是变化的方向; 或者说是最能代表这个事物的特征方向; 权重是特征值,有正有负,加强或抑制; 权重的绝对值大小,代表输入信号对神经元的影响大小

    2024年02月21日
    浏览(53)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包