CV大模型应用：Grounded-Segment-Anything实现目标分割、检测与风格迁移

10月前作者：天海一直在AI 分类：Toy博客阅读(43) 违法举报

这篇具有很好参考价值的文章主要介绍了CV大模型应用：Grounded-Segment-Anything实现目标分割、检测与风格迁移。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

Grounded-Segment-Anything实现目标分割、检测与风格迁移

一、Segment-Anything介绍

代码链接：https://github.com/facebookresearch/segment-anything

论文地址：https://arxiv.org/abs/2304.02643

官网地址：https://segment-anything.com/

继2023年4月5日meta AI发布了Segment Anything的论文和源码后，在github上已经超过了25.3k个⭐️

CV大模型应用：Grounded-Segment-Anything实现目标分割、检测与风格迁移

号称分割一切的此模型，打破了传统的分割任务思路，将CV界震撼。不少大佬们也是开始了这个分割大模型的研究与应用。Segment Anything只针对分割任务，那么我们的物体检测、识别也可以与其结合使用。

二、Grounded-Segment-Anything

1、简介

代码链接：https://github.com/camenduru/grounded-segment-anything

这个项目背后的核心思想是结合不同模型的优势，以构建一个非常强大的管道来解决复杂的问题。值得一提的是，这是一个组合强专家模型的工作流程，其中所有部分可以单独使用，也可以组合使用，并且可以替换为任何类似但不同的模型

比如用GLIP或其他探测器替换Grounding DINO /用ControlNet替换Stable-Diffusion /与ChatGPT组合。

比如官方提供的给“坤坤”换衣服，真实完美搭配！

CV大模型应用：Grounded-Segment-Anything实现目标分割、检测与风格迁移

接下来我将演示如何运行在线的项目。如果想要像在segment Anything官网跑一个demo图片，我们可以进到其colab中来在线运行这个demo

2、测试

首先进入其在线运行地址：https://github.com/camenduru/grounded-segment-anything-colab

打开后，点击colab中的open in colab进入jupyter notebook

CV大模型应用：Grounded-Segment-Anything实现目标分割、检测与风格迁移

首先得确保你有一个能够正常登录的Google账号，在右上角点击展开并登录。已经登录那么可以直接点击连接按钮，并稍等片刻。

CV大模型应用：Grounded-Segment-Anything实现目标分割、检测与风格迁移

连接成功后即可运行代码

CV大模型应用：Grounded-Segment-Anything实现目标分割、检测与风格迁移

等待运行完成后，运行下一个代码块

CV大模型应用：Grounded-Segment-Anything实现目标分割、检测与风格迁移

出现下方链接后点进去即可运行demo（两个都可以）

CV大模型应用：Grounded-Segment-Anything实现目标分割、检测与风格迁移

进入demo之后我们可以传入图片，并输入描述的内容

分割任务例如：a door /a person

描绘任务例如：A man in a jacket

CV大模型应用：Grounded-Segment-Anything实现目标分割、检测与风格迁移

但毕竟是免费的在线运行平台，右侧执行的速度会很慢，取决于分配给你的算力大小。如果需要处理比较复杂的图像或输入的关键词，可能会显示算力不够。

下面是我在上课时随意拍了张照片并传入，运行的一个简单分割demo处理结果（用了5分钟，输入为：a door）

CV大模型应用：Grounded-Segment-Anything实现目标分割、检测与风格迁移

可见，结合GPT、Segment Anything与detection

官方使用inpaint绘制运行结果，传入的目标是 one girl

渲染语句是：mermaid with beautiful face（美丽的美人鱼）

就将检测出的一个女孩渲染成了美人鱼。

但我这里没有运行出来绘制的功能，可能是因为目前模型才刚刚试运行两天，不足以免费让我们跑这种费算力的模型，只能说期待后续的优化吧。文章来源地址https://www.toymoban.com/news/detail-485331.html

到了这里，关于CV大模型应用：Grounded-Segment-Anything实现目标分割、检测与风格迁移的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

【图像分割】Grounded Segment Anything根据文字自动画框或分割环境配置和基本使用教程

要求： python=3.8 , pytorch=1.7, torchvision=0.8 官方地址： https://github.com/IDEA-Research/Grounded-Segment-Anything Marrying Grounding DINO with Segment Anything Stable Diffusion BLIP Whisper ChatBot - Automatically Detect , Segment and Generate Anything with Image, Text, and Audio Inputs - GitHub - IDEA-Research/Grounded-Segment-Anything: Marr

2024年02月05日
浏览(70)
CV大一统模型的第一步！Segment Anything Model 最全解读！

Datawhale干货作者：崔腾松，Datawhale成员 Meta 开源万物可分割 AI 模型：segment anything model (SAM)。本文列举了一些资料，并从SAM的功能介绍、数据集、数据标注、图像分割方法介绍，研发思路以及对未来的展望来展开详细介绍。并综合了一些评价谈论，放眼当下和展望未来，

2023年04月19日
浏览(75)
Segment Anything Model (SAM)——卷起来了，那个号称分割一切的CV大模型他来了

最近每天打开微信看到10个公众号里面差不多有11个都在各种玩赚chatGPT，每个都在说是各种大好风口，哎，看得眼睛都是累的。今天下午无意间看到Meta发布了一款号称能分割一切的CV大模型，CV圈也开始卷起来，今年各种大模型要爆发了感觉。吃瓜群众满怀好奇，点开了解一

2023年04月10日
浏览(51)
Meta AI最新出品，全能的分割模型SAM：掀桌子的Segment Anything，CV届的ChatGPT已经到来！

本来不打算再发关于分割的相关内容的，但是13小时前，2023年4月5号，Meta AI在Arxiv网站发布了文章《Segment Anything》，并将SAM模型代码和数据开源。作为通用的分割网络，SAM或许将成为，甚至是已经成为了CV届的ChatGPT。简简单单的两个词Segment Anything，简单粗暴却不失优雅。说

2023年04月15日
浏览(52)
【CV大模型SAM（Segment-Anything)】如何保存分割后的对象mask？并提取mask对应的图片区域？

上一篇文章【CV大模型SAM（Segment-Anything）】真是太强大了，分割一切的SAM大模型使用方法:可通过不同的提示得到想要的分割目标中详细介绍了大模型SAM（Segment-Anything）的不同使用方法，后面有很多小伙伴给我留言问我分割后的目标对象如何保存，这篇介绍一下分割后的ma

2024年02月09日
浏览(59)
【CV大模型SAM（Segment-Anything）】真是太强大了，分割一切的SAM大模型使用方法:可通过不同的提示得到想要的分割目标

本文主要介绍SAM模型的使用方法：如何使用不同的提示进行目标分割。而且该模型在CPU的环境下就可以快速运行，真心不错~,赶紧来试试吧关于Segment-Anything模型的相关代码、论文PDF、预训练模型、使用方法等，我都已打包好，供需要的小伙伴交流研究，获取方式如下：关

2023年04月18日
浏览(47)
CV界的chatgpt出现——Segment Anything能分割万物

今天亲手体验了一下meta公司发布的Segment Anything，我们认为是cv界的chatgpt，这个模型太厉害了，厉害到可以对任意一张图进行分割，他们的网站上的例子也是挺复杂的，能够说明其强大的能力—demo链接，人工智能的技术迭代真是太快了。在模型的介绍中，有句话着实惊人——

2023年04月18日
浏览(38)
CV不存在了？体验用Segment Anything Meta分割清明上河图

在图像处理与计算机视觉领域，图像分割(image segmentation) 是在像素级别将一个完整图像划分为若干具有特定语义区域(region) 或对象(object) 的过程。每个分割区域是一系列拥有相似特征——例如颜色、强度、纹理等的像素集合，因此图像分割也可视为以图像属性为特征空间，

2023年04月20日
浏览(44)
Segment Anything CV界的GPT—prompt-based里程碑式研究成果

Segment Anything受chatGPT式的prompt-based思路启发，训练数据集涵盖10亿masks，根据提供的图片注释实时产生不同的mask分割结果，试用效果惊人。 Segment Anything之于Computer Vision，相当于chatGPT之于NLP。 4月5日，Meta AI发布了博客：Introducing Segment Anything: Working toward the first foundation model f

2023年04月13日
浏览(55)
Segment Anything模型结构解读

论文地址代码下载官网使用公开数据集训练，并且让人工标注团队进行标注预测的mask，该过程总共进行6次，并产生430万个mask 模型产生的置信度相对较高的mask，不需要人工标注，而置信度相对不高的mask，由人工完成标注。举个例子，模型分割一张图片，总共产生了10个m

2024年02月06日
浏览(93)