【AIGC】商汤SenseNova大模型“超市”

这篇具有很好参考价值的文章主要介绍了【AIGC】商汤SenseNova大模型“超市”。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

1. 商汤发布「日日新 SenseNova」

随着 ChatGPT 掀起的全球狂潮,,国内大厂争先恐后,大模型如雨后春笋遍地开花。

2023年 4月10日,重量级选手「商汤」发布「日日新SenseNova」大模型超市。 看这名字,真的很像超市。

「商汤」在技术交流日分享了以 “大模型+大算力” 推进 AGI(通用人工智能)发展的战略布局,公布了「商汤」的“日日新SenseNova”大模型体系,推出自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。

商汤科技表示,SenseNova 大模型体系主要面向政企客户,可提供多种灵活的 API 接口和服务,包括图片生成,自然语言生成,视觉感知通用任务与标注服务。客户可根据实际应用需求,调用 SenseNova 大模型的各项 AI 技术能力,低门槛、低成本、高效率地实现各类AI应用。


2. SenseCore AI 大算力

商汤 CEO 徐立表示:在AI大模型时代,数据、算法和算力这三要素也在经历新的演变,大模型参数量将以指数级的速率提升,而数据量随着多模态的引入也将大规模增长,因此就必然会导致对算力需求的剧增。

商汤建设的 SenseCore AI 大装置拥有 2.7万块 GPU,可以输出 5.0 exaFLOPS(每秒浮点运算次数)的总算力,最多可以支持20个千亿参数量大模型(千卡并行效率91.5%)同时训练,最高可支持万亿参数超大模型的训练。为日益增长的大模型训练需求提供了可靠、先进的研发环境和充沛的算力供应。

2022 年,SenseCore正式面向行业客户开放能力,提供自动化数据标注、自定义大模型训练、模型增量训练、模型推理部署、开发效率提升等多种大模型服务(Model-as-a-Service):

  • 基于预训练大模型的自动化数据标注,比人工数据标注的效率提升近百倍。

  • 大模型并行训练和模型增量训练服务,能够帮助客户快速利用自有数据训练模型,包括在预训练大模型之上进行垂直领域行业模型的开发,生产自定义模型。

  • 模型推理部署服务,可将大模型推理效率提高100%以上,降低用模型提供服务的成本。

商汤也向行业开发人员开放大量预训练模型及 AI 开发工具链,全面赋能客户提升开发效率。


3. SenseChat 语言大模型

自然语言是人机沟通的关键手段,商汤推出了语言大模型「商量SenseChat」。

【AIGC】商汤SenseNova大模型“超市”

商汤科技全面布局生成类预训练大模型,实现并完善了文本、语音、图像、视频、3D场景的多模态生成能力。

2022年,商汤科技联合上海人工智能实验室、清华大学、香港中文大学、上海交通大学发布了多模态多任务通用大模型“书生(INTERN)”,拥有30亿参数,是目前开源模型社区性能最强的多模态大模型。该模型可以接收处理各种不同模态的输入,并采用统一的模型架构和参数处理各种不同的任务,实现多模态多任务的通用处理能力。该模型已经在通用视觉开源平台 OpenGVLab 开源。

2023年3月,商汤科技开源了多模态(指能够处理文本、图像、音视频等多种数据类型)多任务通用大模型“书生(INTERN)2.5”。书生2.5 具备图文跨模态开放任务处理能力,可为自动驾驶、机器人等通用场景任务提供高效精准的感知和理解能力支持。

“书生 2.5" 可以通过文本来定义任务,从而灵活地定义不同场景的任务需求,并根据给定视觉图像和任务的提示性语句,给出相应的指令或作答,进而具备通用场景下的高级感知和复杂问题处理能力,比如图像描述、视觉问答、视觉推理和文字识别等。

" 书生 2.5" 可以辅助处理各种复杂任务。例如,在自动驾驶场景中,可以大幅提升场景感知理解能力,准确辅助车辆判断交通信号灯状态、道路标志牌等信息,为车辆决策规划提供有效信息输入。

" 书生 2.5" 可以根据文本快速检索出视觉内容,例如,可在相册中返回文本所指定的相关图像,或是在视频中检索出与文本描述最相关的帧,提高视频中时间定位任务的效率。此外还支持引入物体检测框,根据文本返回最相关的物体,实现开放世界视频或图像中物体检测及视觉定位。

「商量SenseChat」是千亿级参数的自然语言处理模型,使用大量数据训练,考虑了中文语境,能够更好地理解和处理中文文本。「商量SenseChat」在演示中展示了多轮对话和超长文本的理解能力。

商汤也展示了语言大模型支持的几项创新应用:

  • 编程助手,可帮助开发者更高效地编写和调试代码。

  • 健康咨询助手,为用户提供个性化的医疗建议。

  • PDF 文件阅读助手,能轻松从复杂文档中提取和概括信息。


4. SenseNova 大模型超市

商汤目前已构建了计算机视觉、自然语言处理、AI内容生成、多模态、决策智能等多个领域的大模型,持续演进能力并广泛支持各种应用。

计算器视觉:商汤科技研发了320亿参数量的全球最大的通用视觉模型,实现了高性能的目标检测、图像分割和多物体识别算法,这些技术在自动驾驶、工业质检、医疗影像等领域得到了广泛应用。

AI内容生成:实现了多个文生图大模型的训练,对文字生图的理解、出图画质与推理速度等任务具备出众的能力。尤其在中国传统文化的理解方面具备独特优势,例如可用古诗词作为提示词来生成对应图片等。画质方面,支持6K高清图的生成,且在光影处理方面更加细腻。

语音识别与合成:研发的语音识别模型在多种场景下实现了高准确率、低延迟的语音转文本能力,还研发了语音合成模型,能够根据用户需求生成具有不同语调、音色的语音,为数字人、智能车舱等产品提供了强大支持。

强化学习与决策智能:研发了一系列高效的决策智能模型。这些模型在机器人控制、游戏AI、自动驾驶决策系统等领域取得了显著的应用成果。

AI芯片与硬件加速:研发了数款高性能、低功耗的AI推理芯片及AI ISP芯片,在数据中心、边缘计算等场景下展现出强大的计算能力。

【AIGC】商汤SenseNova大模型“超市”

「日日新SenseNova」大模型超市还包括各种AI文生图创作、2D/3D数字人生成、大场景/小物体生成等一系列生成式AI模型及应用:

  • “秒画SenseMirage”文生图创作平台,展现了光影真实、细节丰富、风格多变的强大的文生图能力,可支持6K高清图的生成;客户还可根据自身需求训练生成模型。

  • “如影SenseAvatar”AI数字人视频生成平台,仅需一段5分钟的真人视频素材,就可以生成出来声音及动作自然、口型准确、多语种精通的数字人分身。

  • “琼宇SenseSpace”和“格物SenseThings”3D内容生成平台,可以高效低成本生成大规模三维场景和精细化的物件,为元宇宙、虚实融合应用打开新的想象空间。文章来源地址https://www.toymoban.com/news/detail-426439.html


到了这里,关于【AIGC】商汤SenseNova大模型“超市”的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • ​倒计时5天 | AIGC拓世大模型发布会亮点抢先看!

    探索人工智能的未来, 抢先一步洞悉行业趋势! AIGC拓世大模型发布会即将在南昌举行 这场汇聚AI专家与行业领袖的盛会,将以其专业性和创新性震撼全场。 作为人工智能领域独一无二的盛事,本次大会将为与会者带来全面的行业洞察和前沿知识。 数百位AI领域的大咖将云集

    2024年02月08日
    浏览(35)
  • 近屿智能发布AIGC大模型工程师和产品经理学习路径图

    近日,上海近屿智能科技有限公司(下称“近屿智能”),基于其在大模型研发和产品设计领域深厚的专业积累,终于总结出AIGC大模型工程师与产品经理的学习路线图。该学习路线图不仅为追求专业发展的学习者提供了一条清晰明确的AIGC大模型学习路径,更为整个AIGC大模型

    2024年02月21日
    浏览(52)
  • 一周AIGC丨Meta 发布新一代开源大模型 Llama 2,大模型裁员潮不远了?

    人们把Meta发布免费可商用版本 Llama 2比作“安卓时刻”,OpenAI护城河似乎一下子荡然无存,整个大模型市场格局面临巨变。据媒体报道,在以往,中国大模型公司可以靠商业授权赚钱利润,随着Llama 2开始允许商用,中国大模型公司的这一优势现在也没有了。傅盛更是发出预警

    2024年02月11日
    浏览(43)
  • AI大模型内卷加剧,商汤凭什么卷进来

      2023年,国内大模型何其多。 目前,已宣布推出或即将推出大模型的国内企业多达20余家,基本上能想到的相关企业都已入局。其中,既有资金雄厚的BAT、华为、字节等大厂,也有王慧文、王小川、周伯文等互联网大佬领衔的初创企业,还有垂直领域的AI企业,比如商汤科技

    2024年02月13日
    浏览(37)
  • 【LLM】主流大模型体验(文心一言 科大讯飞 字节豆包 百川 阿里通义千问 商汤商量)

    智谱AI体验 百度文心一言体验 科大讯飞大模型体验 字节豆包 百川智能大模型 阿里通义千问 商汤商量 简要分析:仅从测试“老婆饼为啥没有老婆”这个问题的结果来看,chatglm分点作答有条理(但第三点略有逻辑问题);字节豆包的说法有点胡扯,老婆饼怎么会像低头微笑的

    2024年02月08日
    浏览(62)
  • AIGC独角兽官宣联手,支持千亿大模型的云实例发布,“云计算春晚”比世界杯还热闹...

    梦晨 发自 凹非寺 量子位 | 公众号 QbitAI 现在AI最火的方向是什么?那必须是 AIGC (AI Generated Content,利用人工智能技术来生成内容)。 AIGC最火的公司是谁?莫过于开源AI作画模型Stable Diffusion背后的 StabilityAI 。 对于这家新晋独角兽,最近两条动向值得关注: 产品上, Stable

    2024年02月13日
    浏览(41)
  • 精炼爆炸性新闻!OpenAI发布革命性AI视频生成模型Sora:实现长达60秒的高清视频创作「附AIGC行业系统搭建」

    在人工智能领域,每一次技术革新都引领着未来的发展方向。OpenAI,作为全球领先的人工智能研究机构,再次证明了其在推动AI技术革新方面的领导地位。近日,OpenAI宣布推出了一款革命性的AI视频生成模型——Sora,这一大胆的创新举措,无疑将AI视频生成技术推向了一个新的

    2024年02月20日
    浏览(86)
  • 快讯 | 微软开源 Deep Speed Chat;商汤回应自研大模型图片生产质疑;谷歌 Bard 聊天机器人实验更新页面上线

    一分钟速览新闻点 商汤回应自研大模型图片生产质疑 昆仑万维与阿里云达成战略合作,将新建智算中心支撑大模型创新 中科院自动化研究所针对康复机器人提出新的驾驶空间概念 百度Apollo将在上海车展发布智能汽车开放方案 谷歌 Bard 聊天机器人实验更新页面上线,数学和

    2024年02月11日
    浏览(51)
  • AIGC 3D引擎-LayaAir3.0正式版发布了

    2016年6月30日,LayaAir引擎1.0正式版首次发布,今天迎来了它的7周岁生日。 7年,3个大版本,代表着引擎不同阶段、不同的时代、不同的定位。 2016年6月的 第1代引擎版本定位是极致性能 ,支持2D与3D游戏开发, 满足大型游戏流畅运行。 2019年1月的 第2代引擎定位最强国产 WEB

    2024年02月15日
    浏览(50)
  • 【AIGC】重磅消息,GPT-4.5 Turbo将在6月发布?

    2024 年 AI 辅助研发趋势 强烈推荐 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站: 人工智能 GPT-4.5 Turbo 就在昨天GPT-4.5 Turbo 疑似被 OpenAI 网络团队泄露了! Bing和DuckDuck Go等搜索引擎在GPT-4.5 Turbo正式发布之前就已经对

    2024年03月15日
    浏览(45)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包