助力 VR/AR 等复杂图像场景极致高清,火山引擎夺得 NTIRE 大赛双料冠军

这篇具有很好参考价值的文章主要介绍了助力 VR/AR 等复杂图像场景极致高清,火山引擎夺得 NTIRE 大赛双料冠军。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

动手点关注

助力 VR/AR 等复杂图像场景极致高清,火山引擎夺得 NTIRE 大赛双料冠军

干货不迷路

近日,CVPR Workshop 下属的 NTIRE2023大赛公布比赛结果,在双目超分双三次插值保真赛道和 360° 全景图像超分赛道上,火山引擎多媒体实验室凭借自主研发的算法获得了双料冠军,技术能力达到行业领先水平。

NTIRE(New Trends in Image Restoration and Enhancement)是新兴的计算机视觉国际竞赛,每年在模式识别和机器视觉顶级国际会议 CVPR(CCF-A)上举行。该比赛旨在鼓励学者和研究人员探索计算机视觉中图像恢复和提升的新技术和方法,并且促进学术交流,在计算机视觉领域获得了广泛的关注和参与,吸引了众多高校和业界知名公司参加。

助力 VR/AR 等复杂图像场景极致高清,火山引擎夺得 NTIRE 大赛双料冠军

助力 VR/AR 等复杂图像场景极致高清,火山引擎夺得 NTIRE 大赛双料冠军

双目超分比赛结果

助力 VR/AR 等复杂图像场景极致高清,火山引擎夺得 NTIRE 大赛双料冠军

助力 VR/AR 等复杂图像场景极致高清,火山引擎夺得 NTIRE 大赛双料冠军

360°全景图像超分比赛结果

双目超分(双三次插值保真)赛道:自研 HTCN 网络,显著提升立体视觉图像分辨效果

随着双目成像技术的发展,移动电话、虚拟现实、自动驾驶和机器人中的双目相机应用越来越受欢迎,高分辨率双目图像包含更多的纹理细节,具有更好的主观视觉效果,且可以提升下游任务性能, 因此立体视觉引起了学术界和工业界的越来越多的关注。双目图像超分的简单直接方式是将单图超分辨率算法分别应用于左右视角图像,但是这样会忽略双目图像左右视角之间的信息关联--左右视角图像可以在超分过程中利用左右视角间的互补信息互为参考,同时也为双目图像超分提供额外的先验约束。因此合理利用左右视角间的互补信息对提升双目图像超分性能至关重要。本次竞赛双目超分双三次插值保真赛道旨在为双目图像SR建立一个利用双三次插值下采样的基准,并且利用最后的保真指标作为评价指标,为研究人员提供了一个共同分享他们的知识和见解的机会,推进算法性能的提高,促进立体图像超分辩技术的发展。

在图像恢复任务中,经常采用多阶段的处理策略。虽然基于 Transformer 的方法在单图像超分辨率任务中表现出高效率,但在立体超分辨率任务中还没有展现出比基于 CNN 的方法更显著的优势。这可以归因于两个关键因素:首先,当前的单图像超分辨率 Transformer 在处理过程中无法利用补充的立体信息;其次,Transformer 的性能通常依赖于充分的数据,而在常见的立体图像超分辨率任务中缺乏足够的数据。为了解决这些问题,团队提出了一种混合 Transformer 和 CNN 注意力网络(HTCAN),它利用基于 Transformer 的网络进行单图像增强和基于 CNN 的网络进行立体信息融合。此外,团队采用了 multi-patch 训练策略和更大的窗口尺寸,以扩大感知域。团队还重新审视了其他高级技术,如数据增强、数据合成和模型合成,以减少过拟合和数据偏差,最终超过其他竞争对手,获得第一名的成绩。

论文链接: https://arxiv.org/pdf/2305.05177.pdf

助力 VR/AR 等复杂图像场景极致高清,火山引擎夺得 NTIRE 大赛双料冠军

整体双目超分策略

360° 全景图像超分赛道:两阶段框架提升全方位视角图像分辨率

360° 全景图像是一种能够呈现全方位视角的图像,能够提供更加沉浸式和交互式的体验,因此在 VR/AR 应用中得到了广泛的应用。然而,由于采用的鱼眼镜头等原因,360° 全景图像的分辨率较低,影响了图像的清晰度和细节。因此,如何提高 360° 全景图像的分辨率成为了一个重要的研究方向。

超分辨率是一种图像处理技术,旨在通过从低分辨率图像中恢复高分辨率图像的细节信息来提高图像的分辨率。在 360° 全景图像中,超分辨率技术可以通过从低分辨率的全景图像中恢复缺失的高频信息来提高图像的清晰度和细节,从而提高用户的体验。

在此次竞赛中,团队提出了一种 360° 全景图像超分辨率的两阶段框架。第一阶段采用了两个分支:Model A,它包含全景位置感知可变形块(OPDB)和傅里叶上采样;Model B 在模型 A 的基础上增加了空间频率融合模块(SFF)。Model A 旨在增强 360° 图像位置信息的特征提取能力,而 Model B 进一步关注 360° 图像的高频信息。第二阶段基于 Model A 的结构进行 360° 图像的同分辨率增强。此外,团队从公开数据集收集球面数据并使用退化网络生成伪低分辨率图像,以提高 Transformer 的拟合能力。团队提出的方法取得了卓越的性能,并赢得了 NTIRE 2023 360° 全景图像超分辨率挑战赛的冠军。

论文链接: https://arxiv.org/pdf/2304.13471.pdf

助力 VR/AR 等复杂图像场景极致高清,火山引擎夺得 NTIRE 大赛双料冠军

整体球面超分策略

助力 VR/AR 等复杂图像场景极致高清,火山引擎夺得 NTIRE 大赛双料冠军

Model A 和 Model B 的网络结构

火山引擎多媒体实验室在双目超分双三次插值保真和 360° 全景图像超分领域实现了突破性的进展,并获得了双赛道冠军。两项技术方案可以帮助广大用户在多样化的复杂场景中获得更为清晰、精细的图像展现效果,有助于推动视频行业向着更加智能化、高效化的方向发展。其中,360° 全景图像超分技术已在幸福里 app 落地应用,并通过火山引擎 veImageX 产品面向企业开放。

火山引擎多媒体实验室是字节跳动旗下的研究团队,致力于探索多媒体领域的前沿技术,参与国际标准化工作,其众多创新算法及软硬件解决方案已经广泛应用在抖音、西瓜视频等产品的多媒体业务,并向火山引擎的企业级客户提供技术服务。实验室成立以来,多篇论文入选国际顶会和旗舰期刊,并获得数项国际级技术赛事冠军、行业创新奖及最佳论文奖。

火山引擎是字节跳动旗下的云服务平台,将字节跳动快速发展过程中积累的增长方法、技术能力和工具开放给外部企业,提供云基础、视频与内容分发、大数据、人工智能、开发与运维等服务,帮助企业在数字化升级中实现持续增长。

加入我们

字节跳动视频架构是字节跳动的视频中台部门,支持字节跳动旗下产品的点播、直播、实时通信、图片、多媒体业务发展,目标成为业界多媒体解决方案领先者,构建极致的视频技术/产品服务体验。

目前,视频架构团队已通过字节跳动旗下的火山引擎向企业开放技术能力和服务。

火山引擎 联系方式

  • 业务咨询:service@volcengine.com

  • 市场合作:marketing@volcengine.com

  • 电话:400-850-0030

扫描下方二维码 or 点击文末阅读原文进行简历投递,加入我们,让我们一起做多媒体领域的领军者!

视频编解码算法工程师-多媒体实验室(北京/上海/杭州/深圳职位开放)

助力 VR/AR 等复杂图像场景极致高清,火山引擎夺得 NTIRE 大赛双料冠军 点击「阅读原文」即刻投递文章来源地址https://www.toymoban.com/news/detail-473729.html

到了这里,关于助力 VR/AR 等复杂图像场景极致高清,火山引擎夺得 NTIRE 大赛双料冠军的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • AI、大数据、量子计算、区块链、机器学习、深度学习、图像识别、NLP、搜索引擎、云计算、物联网、AR/VR、智能交通、智能驾驶等多个领域的基础技术到应用产品介绍

    作者:禅与计算机程序设计艺术 本文综述 AI、大数据、量子计算、区块链、机器学习、深度学习、图像识别、NLP、搜索引擎、云计算、物联网、AR/VR、智能交通、智能驾驶等多个领域,涵盖了从基础技术到应用产品的方方面面,大胆探索了未来数字化转型的机遇和挑战。 人工

    2024年02月11日
    浏览(55)
  • 火山引擎ByteHouse:一套方案,让OLAP引擎在精准投放场景更高效

    由于流量红利逐渐消退,越来越多的广告企业和从业者开始探索精细化营销的新路径,取代以往的全流量、粗放式的广告轰炸。精细化营销意味着要在数以亿计的人群中优选出那些最具潜力的目标受众,这无疑对提供基础引擎支持的数据仓库能力,提出了极大的技术挑战。

    2024年02月12日
    浏览(38)
  • 火山引擎在行为分析场景下的ClickHouse JOIN优化

    更多技术交流、求职机会,欢迎关注 字节跳动数据平台微信公众号,回复【1】进入官方交流群 火山引擎增长分析DataFinder基于ClickHouse来进行行为日志的分析,ClickHouse的主要版本是基于社区版改进开发的字节内部版本。主要的表结构:   事件表:存储用户行为数据,以 用户

    2023年04月26日
    浏览(40)
  • AI引擎助力,CamScanner智能高清滤镜开启扫描新纪元!

    在数字化快速发展的今天,我们时常会遇到需要将纸质文件转变为电子文字的场景。无论是工作中的合同、报告,还是日常生活中的笔记、名片,这些纸质资料在电子化处理的过程中往往让人感到头疼。拍摄角度不佳、光线不足、图像模糊,种种问题让传统扫描软件变得繁琐

    2024年02月12日
    浏览(40)
  • 案例 | 3D可视化工具HOOPS助力SolidWorks edrawings成功引入AR/VR技术

    HOOPS中文网 慧都科技是HOOPS全套产品中国地区指定授权经销商,提供3D软件开发工具HOOPS售卖、试用、中文试用指导服务、中文技术支持。 http://techsoft3d.evget.com/ 达索系统SolidWorks面临的挑战 达索系统SolidWorks公司开发和销售三维CAD设计软件、分析软件和产品数据管理软件。通过

    2024年02月03日
    浏览(49)
  • VR/AR/XR背后的逻辑?离不开三维引擎相机

    作者:木一 自从Apple Vision Pro问世以来,这款被誉为开启“ 空间计算时代 ”的产品迅速吸引了众多科技博主的深度关注。业界对它的评价褒贬不一,一些人认为它是一款具有里程碑意义的创新产品,而另一些人则认为它不过是众多高质量虚拟现实(VR)产品中的一员。尽管市

    2024年04月12日
    浏览(52)
  • 【AR or VR】浅谈AR和VR的优劣

    一、引言 虚拟现实(VR)和增强现实(AR)是两种不同的技术,各自有着自己的优点和挑战。它们的应用领域也不完全相同,因此无法简单地说哪种技术更具有潜力改变未来。 首先,虚拟现实技术可以创造出一个完全的虚拟环境,让用户完全沉浸其中。这种技术可以应用于游

    2024年02月05日
    浏览(49)
  • 死磕“增长”:火山引擎的实用主义

    作者 | 曾响铃 文 | 响铃说 在刘慈欣的科幻小说《三体》中,地外文明为了封锁地球科技,在天文台向地球科学家展现了「宇宙闪烁」这一奇观,试图颠覆人类的认知,从而影响科技进步,促使地球科技发展陷入停滞。 如今,「宇宙闪烁」一词被火山引擎用到了4月18日的20

    2024年02月06日
    浏览(35)
  • 火山引擎边缘云,助你沉浸式回忆童年

    发现了吗?在抖音、西瓜视频上能观看4K修复的经典港片了!得益于抖音、中国电影资料馆、火山引擎共同发起的“经典香港电影修复计划”,我们童年时期看过的《大话西游之大圣娶亲》《武状元苏乞儿》等22部港片以更清晰、流畅、颜色饱满的状态回归了! 画面来自《武

    2024年02月11日
    浏览(47)
  • 火山引擎发布自研视频编解码芯片

    2023年8月22日,火山引擎视频云宣布其自研的视频编解码芯片已成功出片。经验证,该芯片的视频压缩效率相比行业主流硬件编码器可提升30%以上,未来将服务于抖音、西瓜视频等视频业务,并将通过火山引擎视频云开放给企业客户。 火山引擎总裁谭待表示,视频数据量呈爆

    2024年02月11日
    浏览(43)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包