Segment Anything模型结构解读

10月前作者：Soonki 分类：Toy博客阅读(92) 违法举报

这篇具有很好参考价值的文章主要介绍了Segment Anything模型结构解读。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

论文地址
代码下载
官网

关于Segment Anything的理解

1.人工标注过程

使用公开数据集训练，并且让人工标注团队进行标注预测的mask，该过程总共进行6次，并产生430万个mask

2.半自动标注过程

模型产生的置信度相对较高的mask，不需要人工标注，而置信度相对不高的mask，由人工完成标注。举个例子，模型分割一张图片，总共产生了10个mask，其中有5个分割得很好，这部分就作为自动标注的mask，另外5个效果不好，就进行人工标注。该过程总共进行5次，产生590万个mask

3.全自动过程

让模型完成全自动的标注。通过IoU过滤置信度不高的mask，并且进行去重操作，产生11亿的mask

关于数据集SA-1B

数据集相当大，尝试下载一个tar，大概10个G，压缩包总共可能有10T
SA-1B数据下载

关于网络模型

网络总共有三个部分：image_encoder、prompt_encoder和mask_decoder。个人感觉网络模型还是很大的，下面是细化的网络模型也是代码结构
Segment Anything模型结构解读

image_encoder部分：

Segment Anything模型结构解读

prompt_encoder部分：

Segment Anything模型结构解读

mask_decoder部分：

Segment Anything模型结构解读文章来源地址https://www.toymoban.com/news/detail-463097.html

到了这里，关于Segment Anything模型结构解读的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

CV大一统模型的第一步！Segment Anything Model 最全解读！

Datawhale干货作者：崔腾松，Datawhale成员 Meta 开源万物可分割 AI 模型：segment anything model (SAM)。本文列举了一些资料，并从SAM的功能介绍、数据集、数据标注、图像分割方法介绍，研发思路以及对未来的展望来展开详细介绍。并综合了一些评价谈论，放眼当下和展望未来，

2023年04月19日
浏览(75)
【Segment Anything Model】论文+代码实战调用SAM模型预训练权重+相关论文

上篇文章已经全局初步介绍了SAM和其功能，本篇作为进阶使用。点击订阅专栏查看专栏列表和对应知识点，本文为seg SAM系列文章，在持续更新。

2024年02月05日
浏览(52)
【论文阅读】Segment Anything（SAM）——可分割一切的CV大模型

【前言】随着ChatGPT席卷自然语言处理，Facebook凭借着Segment Anything在CV圈也算扳回一城。迄今为止，github的star已经超过3万，火的可谓一塌糊涂。作为AI菜鸟，可不得自己爬到巨人肩膀上瞅一瞅~ 论文地址：https://arxiv.org/abs/2304.02643 代码地址：GitHub - facebookresearch/segment-anything: T

2024年02月15日
浏览(44)
【自用】SAM模型论文笔记与复现代码（segment-anything-model）

一个 prompt encoder ，对提示进行编码， image encoder 对图像编码，生成embedding, 最后融合2个 encoder ，再接一个轻量的 mask decoder ，输出最后的mask。模型结构示意图：流程图：模型的结构如上图所示. prompt会经过 prompt encoder , 图像会经过 image encoder 。然后将两部分embedding经过一个

2024年01月24日
浏览(47)
Segment Anything论文翻译，SAM模型，SAM论文，SAM论文翻译；一个用于图像分割的新任务、模型和数据集；SA-1B数据集

论文链接： https://arxiv.org/pdf/2304.02643.pdf https://ai.facebook.com/research/publications/segment-anything/ 代码连接：https://github.com/facebookresearch/segment-anything 论文翻译： http://t.csdn.cn/nnqs8 https://blog.csdn.net/leiduifan6944/article/details/130080159 本文提出Segment Anything (SA)项目:一个用于图像分割的新任务

2023年04月19日
浏览(51)
Segment Anything——论文笔记

home page：segment-anything.com code：segment-anything 介绍：SAM是最近提出的一种通用分割大模型，其表现出了强大的零样本泛化能力，视觉感知模型的通用化又前进了一步。为了达到文章标题字面意义“segment anything”，那么就需要该算法具有强大的物体语义感知能力，在模型的设计阶

2024年02月10日
浏览(39)
论文阅读 - Segment Anything

Meta推出的Segment Anything开源之后，一下成为了CV界的网红。本文是对Segment Anything这篇论文的精读，其中会有一些个人的见解。为了让更多人了解到SAM的重要意义，本文会尽量写的白话一些，让非深度学习工作者也能知道SAM的工作原理。这部分写给非深度学习工作者。几乎所

2023年04月24日
浏览(39)
论文阅读--Segment Anything

Title: Segment Anything Abstract: We introduce the Segment Anything (SA) project: a new task, model, and dataset for image segmentation. Using our efficient model in a data collection loop, we built the largest segmentation dataset to date (by far), with over 1 billion masks on 11M licensed and privacy respecting images. The model is designed and trained to

2024年02月16日
浏览(43)
Segment Anything【论文翻译】

https://segment-anything.com/ https://arxiv.org/pdf/2304.02643.pdf 本文由博主墨理学AI 借助翻译工具对该论文进行了翻译我们介绍Segment Anything（SA）项目：这是一个全新的任务、模型和图像分割数据集。通过在数据收集循环中使用我们高效的模型，我们建立了迄今为止最大的分割数据

2024年02月14日
浏览(55)
Segment Anything论文阅读笔记

Abstract Segment Anything (SA) project: a new task, model, and dataset for image segmentation. we built the largest segmentation dataset to date ( by far:迄今为止 ), with over 1 billion masks on 11M licensed and privacy respecting images. The model is designed and trained to be promptable , so it can transfer zero-shot to new image distributions and task

2024年02月16日
浏览(47)