3 个令人惊艳的 AI 项目,开源了!

这篇具有很好参考价值的文章主要介绍了3 个令人惊艳的 AI 项目,开源了!。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

公众号关注 “GitHubDaily”

设为 “星标”,每天带你逛 GitHub!

ai开源项目,人工智能,深度学习,python,计算机视觉,机器学习

过去一周,从外界看,AI 貌似放缓了进步速度,但只有身处其中的人才能知道,AI 一直没有停下进化的脚步。

以下是 GitHub 过去一周,诞生的多个实用的 AI 开源项目,今天给大家做下介绍。

1. Meta 开源 AI 生成音乐模型

Meta 今天在 GitHub 开源了一个 Python 库:Audiocraft,可直接用 AI 生成音乐。

点击播放下方视频,查看音乐生成效果:

GitHub:https://github.com/facebookresearch/audiocraft

里面主要用到了一个名为 MusicGen 的音乐生成模型,MusicGen 是一个单级自回归 Transformer 模型,在 32kHz EnCodec 分词器上训练,具有 4 个以 50Hz 采样的码本。

与 MusicLM 等现有方法不同,MusicGen 不需要自我监督的语义表示,它一次生成所有 4 个码本。

卷完了文生文和文生图,接下来就看文本生成音乐要怎么发力了。

2. Diffusers 发布重磅更新

Diffusers v0.17.0 正式发布,改进了 LoRA、Kandinsky 2.1、Torch 编译加速等特性。

Diffusers 是 GitHub 上一个知名的预训练扩散模型首选库,可用于生成图像、音频,甚至分子的 3D 结构。

ai开源项目,人工智能,深度学习,python,计算机视觉,机器学习

GitHub:https://github.com/huggingface/diffusers

无论你是在寻找简单的推理解决方案还是训练自己的扩散模型,Diffusers 均可作为模块化工具箱提供支持。

该库设计重在可用性与可定制性,主要提供以下 3 个核心组件:

  • 最先进的扩散管道,只需几行代码即可在推理中运行;

  • 可互换的噪声调度器,用于不同的扩散速度和输出质量;

  • 预训练模型可用作构建块,并与调度程序结合使用,用于创建自己的端到端扩散系统。

该项目由 Hugging Face 免费开源,你可以用它来快速训练 ControlNet,以便进一步提升 AI 绘画的效果与质量。

3. 万物皆可识别

Meta 之前在 GitHub 上开源过一个 Segment Anything Model,可自动实现图像切割。

不过该模型在图像定位表现出色,但在图像识别方面便反响平平。

为此,复旦大学联合 OPPO 研究员、国际数字经济学院,在 GitHub 开源了一个强大的图像标记基础模型:Recognize Anything Model (RAM)

该模型采用一种新的图像标记范例,可高精度地识别任何常见类别,并利用大规模图像文本对进行训练,而不是手动注释。

ai开源项目,人工智能,深度学习,python,计算机视觉,机器学习

GitHub:https://github.com/xinyu1205/Recognize_Anything-Tag2Text

RAM 的开发包括四个关键步骤:

  1. 通过自动文本语义解析大规模获取无注释图像标签;

  2. 使用统一标题和标记任务,训练初步模型进行自动注释,分别由原始文本和解析标签监督;

  3. 利用数据引擎生成额外注释并清除不正确的注释;

  4. 利用处理后的数据对模型进行再训练,并使用更小但质量更高的数据集进行微调。

经过众多基准测试评估,RAM 的标记能力颇为优秀,效果明显优于 CLIP 和 BLIP。值得注意的是,RAM 甚至超越了完全监督的方式,甚至可媲美 Google API。

于此同时,该项目里面还包含着一个名为 Tag2Text 的工具,可直接批量化给图像中的指定对象,生成标签。

如果结合 Meta 开源的 SAM 模型,那我们就能做到批量移除图像中的指定对象,进一步提升图像处理效率。

以上,就是本期给大家推荐的 AI 开源项目。

如果你想了解更多 AIGC 相关的内容,欢迎扫描文章底部二维码,加入我们星球进一步探讨交流:

ai开源项目,人工智能,深度学习,python,计算机视觉,机器学习文章来源地址https://www.toymoban.com/news/detail-620628.html

到了这里,关于3 个令人惊艳的 AI 项目,开源了!的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 人工智能_普通服务器CPU_安装清华开源人工智能AI大模型ChatGlm-6B_001---人工智能工作笔记0096

    使用centos安装,注意安装之前,保证系统可以联网,然后执行yum update 先去更新一下系统,可以省掉很多麻烦 20240219_150031 这里我们使用centos系统吧,使用习惯了. ChatGlm首先需要一台个人计算机,或者服务器, 要的算力,训练最多,微调次之,推理需要算力最少 其实很多都支持CPU,但为什么

    2024年02月20日
    浏览(63)
  • AI驱动的未来:探索人工智能的无限潜力 | 开源专题 No.39

    这一系列开源项目代表着多个领域的最新技术成果,包括深度学习、自然语言处理、计算机视觉和分布式训练。它们共同的特点是致力于教育、资源分享、开源精神、多领域应用以及性能和效率的追求,为广大开发者、研究者和学生提供了宝贵的工具和知识,推动了人工智能

    2024年02月08日
    浏览(59)
  • 一个令人惊艳的ChatGPT项目,开源了!

    最近在GitHub上发现了一个爆火的开源项目。 好家伙,凑近一看,居然还是 由微软开源 ,并且和最近炙手可热的 ChatGPT息息相关 。 项目的名字叫做: Visual ChatGPT 。 https://github.com/microsoft/visual-chatgpt 这个项目最早是3月上旬微软开源的,项目宣布开源后仅用了短短一周,就斩获

    2023年04月08日
    浏览(38)
  • 人工智能_CPU安装运行ChatGLM大模型_安装清华开源人工智能AI大模型ChatGlm-6B_004---人工智能工作笔记0099

    上一节003节我们安装到最后,本来大模型都可以回答问题了,结果, 5分钟后给出提示,需要GPU,我去..继续看官网,如何配置CPU运行  没办法继续看: 这里是官网可以看到  需要gcc的版本是11.3.0,这里我们先没有去安装,直接试试再说 yum install epel-release yum install gcc-11.3.0 安装的话执行这

    2024年02月21日
    浏览(66)
  • AI日报:苹果为使用Mac的人工智能开发者推出开源工具

    苹果正在为开发人员提供新的工具,用于在其硬件上训练和运行大型语言模型。 苹果公司通过发布一系列新的开源人工智能工具,向开源人工智能领域致敬。 用于机器学习的MLX框架是专门为苹果的Silicon处理器架构开发的。MLX可通过GitHub获得,旨在简化苹果硬件上的机器学习

    2024年02月04日
    浏览(72)
  • 6 个令人惊艳的 ChatGPT 项目,开源了!

    公众号关注 “GitHubDaily” 设为 “星标”,每天带你逛 GitHub! 过去一周,技术圈的各个爆炸新闻,可以说是让我真正见证到了什么叫人间一日,AI 一年。 首先是 New Bing 对所有用户放开,注册即可用,然后周三 Google 发布 ChatGPT 的对手产品 Bard,周四 GitHub 推出 GitHub Copilot X,

    2023年04月12日
    浏览(62)
  • 3 个令人惊艳的 ChatGPT 项目,开源了!

    公众号关注 “GitHubDaily” 设为 “星标”,每天带你逛 GitHub! 随着 ChatGPT 的爆火,最近几天时间,GitHub 上也有不少新项目涌出,除了在前面给大家推文介绍过的开源项目,近日也有一些不错的工具与解决方案出现。 下面,我将给大家分享 3 个近日在 GitHub 上较为活跃的,具

    2024年02月07日
    浏览(37)
  • 4个令人惊艳的ChatGPT项目,开源了

    这个是微软开源的项目,一周多的时间,就斩获了 23.6k+ star 。 简单概括它,那就是一个多模态的问答系统。 支持 AI 绘画 、 语言问答 、 看图问答 ,将 AI 届近期的 3 大热点集于一身。 效果展示:   系统实现框架如下:   Visual ChatGPT的系统实现框架 这是一个 “ 大力出奇迹

    2023年04月21日
    浏览(43)
  • AI人工智能培训老师叶梓:大数据治理的关键工具:开源数据血缘分析系统

    在大数据时代,数据的产生和传播速度日益加快,数据之间的关系也变得日益复杂。为了更好地管理和理解数据之间的关系,数据血缘分析系统应运而生。本文将介绍几个开源的数据血缘分析系统,它们在数据治理、数据质量管理和数据隐私保护等方面发挥着重要作用。 血缘

    2024年04月23日
    浏览(78)
  • 成为钢铁侠!只需一块RTX3090,微软开源贾维斯(J.A.R.V.I.S.)人工智能AI助理系统

    梦想照进现实,微软果然不愧是微软,开源了贾维斯(J.A.R.V.I.S.)人工智能助理系统,贾维斯(jarvis)全称为Just A Rather Very Intelligent System(只是一个相当聪明的人工智能系统),它可以帮助钢铁侠托尼斯塔克完成各种任务和挑战,包括控制和管理托尼的机甲装备,提供实时情报和

    2024年02月02日
    浏览(46)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包