智源社区AI周刊No.107:英伟达推出Magic3D;Stable Diffusion2.0发布

这篇具有很好参考价值的文章主要介绍了智源社区AI周刊No.107:英伟达推出Magic3D;Stable Diffusion2.0发布。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

汇聚每周AI热点,不错过重要资讯!欢迎扫码,关注并订阅智源社区AI周刊。

英伟达推出Magic3D,性能超过谷歌DreamFusion

近一段时间,让AI生成3D点云成为业界研究的重点。谷歌曾在9月提出DreamFusion,引起广泛关注。近日,英伟达提出了Magic3D,可以从文字描述中生成3D的AI模型。整个生成过程分为三个阶段,首先团队使用eDiff作为低分辨率图像先验,获得初始3D表示。之后通过反复的抽样和渲染,来训练和优化模型,并最终抽取出3D体素。之后,研究者采用扩散模型,对第一阶段获得的粗略模型进行抽样和渲染,优化为更高分辨率的图像。最终获得高分辨率的3D生成结果。

智源社区AI周刊No.107:英伟达推出Magic3D;Stable Diffusion2.0发布,人工智能,3d,stable diffusion,计算机视觉,深度学习

Magic3D实现了根据输入的问题获得较高分辨率的3D图像。同时,用户还可以对提示文本进行修改,实现对于生成3D图像的编辑和修改。

Stable Diffusion 2.0支持超分辨率,结合景深信息:专业图像生成AI再进一步

近日,Stablity AI发布了Stable Diffusion的2.0版本。在这一版采用了研究组织LAION研发的OpenCLIP模型。此外,2.0版本中包括高级Diffusion模型,现在可以沈城2048x2048甚至更高像素的图像。另一方面,研究者提出了Depth-to-Image Diffusion模型,可以推断输入图像的景深,利用提示文本生成新图像。

智源社区AI周刊No.107:英伟达推出Magic3D;Stable Diffusion2.0发布,人工智能,3d,stable diffusion,计算机视觉,深度学习

自从Stable Diffusion开放以来,短短数月已经成为全球最为火爆的AIGC工具,但从玩具到生产力工具,模型本身的性能成为了新的瓶颈。本次Stable Diffusion2.0的更新更偏向于常规的功能改进,但其未来的目标是明确的:进军专业领域,让更多业内人士能够依赖它的力量。

谷歌Pitchfork实现自动编写代码和修bug功能,已投入使用

近日,谷歌实验室(Google X)曝光了一项新的孵化项目——Pitchfork。该系统可以自动编写代码,并修改代码中的bug。目前该系统已经在实验室内部投入使用,能够降低开发成本。

代码模型是继预训练语言模型后研究机构关注的另一个重点领域。由于代码相比自然语言具有更为严格的结构,需要生成的代码更为精细准确,因此对于中小机构而言难度较高。2021年,GitHub联合OpenAI利用大量的开源代码数据训练了Codex模型,并以此研发了Copilot代码补全插件,目前已有超过一百万的用户。

代码模型对于生产力的提升,降低研发成本具有显著作用。据统计,在目前十几种流行编程语言中,有40%是依赖Copilot生成的,而GitHub预计,五年内开发人员将使用Copilot编写超过80%的代码。代码模型在解决复杂编程问题上也具有潜力,DeepMind研发的AlphaCode模型在Codeforces编程竞赛平台上的排名位于前54.3%,即击败了超过40%的人类参赛者。

社区活动

  1. 报名 | 第一届机器学习算法于自然语言处理大会(MLNLP,11月26日)

  2. 报名 | DeepMind研究科学家,AlphaTensor论文一作亲讲:通过强化学习发现更快的矩阵乘法算法(智源社区,12月2日)

  3. 回放 | 北京交通大学教授魏云超:连续学习下像素理解的相关算法介绍


查看预训练、强化学习等领域周刊内容,欢迎点击阅读原文

招聘、活动、推广等合作,请联系:editor@baai.ac.cn文章来源地址https://www.toymoban.com/news/detail-549694.html

到了这里,关于智源社区AI周刊No.107:英伟达推出Magic3D;Stable Diffusion2.0发布的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • [CVPR-23-Highlight] Magic3D: High-Resolution Text-to-3D Content Creation

    目录 Abstract Background: DreamFusion High-Resolution 3D Generation Coarse-to-fine Diffusion Priors Scene Models Coarse-to-fine Optimization NeRF optimization Mesh optimization Experiments Controllable 3D Generation Personalized text-to-3D Prompt-based editing through fine-tuning DreamFusion是目前基于文本的3D生成任务的主流方法,但它有两

    2024年02月13日
    浏览(32)
  • 英伟达推出免训练,可生成连贯图片的文生图模型

    目前,多数文生图模型皆使用的是随机采样模式,使得每次生成的图像效果皆不同,在生成连贯的图像方面非常差。 例如, 想通过AI生成一套图像连环画,即便使用同类的提示词也很难实现 。虽然DALL·E 3和Midjourney可以对图像实现连贯的生成控制,但这两个产品都是闭源的。

    2024年02月22日
    浏览(28)
  • 「SQL面试题库」 No_107 净现值查询

    「SQL面试题库」是由 不是西红柿 发起,全员免费参与的SQL学习活动。我每天发布1道SQL面试真题,从简单到困难,涵盖所有SQL知识点,我敢保证只要做完这100道题,不仅能轻松搞定面试,代码能力和工作效率也会有明显提升。 1.1 活动流程 整理题目 :西红柿每天无论刮风下雨

    2024年02月11日
    浏览(35)
  • 智源AI日报(2022-08-26):当下最强的 AI art 生成模型 Stable Diffusion 最全面介绍

    【智源AI日报】每天速读5分钟,AI要事不错过! 欢迎点击这里,关注并订阅智源AI日报。 盘点 | 当下最强的 AI art 生成模型 Stable Diffusion 最全面介绍  看点:程序员漫画家西乔撰文,包括:关于SD的模型效果展示、注册方式、参数设置、收费标准、版权问题、改进方法以及SD研

    2024年02月10日
    浏览(31)
  • 宣布推出 .NET 社区工具包 8.1!

    我们很高兴地宣布 .NET Community Toolkit 8.1 版正式发布!这个新版本包括呼声很高的新功能、bug 修复和对 MVVM 工具包源代码生成器的大量性能改进,使开发人员在使用它们时的用户体验比以往更好!  就像在我们之前的版本中一样,我们非常感谢 Microsoft 使用该工具包的团队以及

    2024年02月04日
    浏览(58)
  • 专访HuggingFace CTO:开源崛起、创业故事和AI民主化丨智源独家

    导读 HuggingFace CTO Julien Chaumond认为,在大模型时代,AI民主化至关重要。随着大语言模型和复杂人工智能系统的崛起,持续提升AI技术的可及性有助于确保这些技术的获取和控制不集中在少数强大实体手中。技术民主化促进了机会均等,减少了数字鸿沟,而说起来容易做起来难

    2024年02月05日
    浏览(26)
  • 文本生成高精准3D模型,北京智源AI研究院等出品—3D-GPT

    北京智源AI研究院、牛津大学、澳大利亚国立大学联合发布了一项研究—3D-GPT,通过文本问答方式就能创建高精准3D模型。 据悉,3D-GPT使用了大语言模型的多任务推理能力,通过任务调度代理、概念化代理和建模代理三大模块,简化了3D建模的开发流程实现技术民主化。 但3D-

    2024年02月03日
    浏览(32)
  • Casbin开源社区推出开源身份认证、单点登录框架Casdoor

    Casbin开源社区推出开源身份认证、单点登录框架Casdoor! 开源地址:https://github.com/casbin/casdoor 在线演示:https://door.casbin.com/ 技术文档:https://casdoor.org/docs/overview 目前支持以下特性: 前后端分离架构,Go语言开发,支持高并发,具有Web可视化管理界面,支持多语言(中文、英

    2023年04月08日
    浏览(34)
  • 2022北京智源大会开放注册,LeCun、Shamir等图灵奖得主领衔,共赴年度AI内行盛会!...

    北京智源大会始自2019年,每年邀请包括图灵奖得主在内的200多位全球人工智能领域顶尖学者、专家共同探讨学术、技术和产业最新进展,吸引超过3万专业观众注册,超过30个国家和地区200万人次参与。 作为国际性、权威性、专业性和前瞻性的“内行AI盛会”,智源大会已成为

    2024年02月07日
    浏览(33)
  • 最新 .NET 社区工具包, 推出MVVM 源代码生成器!

    我们很高兴地宣布正式推出新的 .NET 社区工具包,现在已经在NuGet上发布了8.0.0版本!这是一个重要版本,包括大量新功能、改进、优化、错误修复和许多反映了全新项目结构和组织的重构,这篇博文将详细描述这些内容。 与每个社区工具包版本一样,所有的更改都受到使用

    2024年02月04日
    浏览(76)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包