微软官宣放出一个「小模型」，仅2.7B参数，击败Llama2和Gemini Nano 2

1年前作者：夕小瑶分类：Toy博客阅读(7)违法举报

这篇具有很好参考价值的文章主要介绍了微软官宣放出一个「小模型」，仅2.7B参数，击败Llama2和Gemini Nano 2。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

就在前一阵谷歌深夜炸弹直接对标 GPT-4 放出 Gemini 之后，微软这两天也紧锣密鼓进行了一系列动作。尽管时间日趋圣诞假期，但是两家巨头硬碰硬的军备竞赛丝毫没有停止的意思。

就在昨日，微软官宣放出一个“小模型” Phi-2，这个 Phi-2 仅有 27 亿的参数（注意不是 27 B），但却在参数规模小于 13B 的模型中达到了最先进性能，利用微软在模型扩展与训练数据管理方面的创新，Phi-2 的性能可以直接匹敌参数量超过其 25 倍的模型！

微软官宣放出一个「小模型」，仅2.7B参数，击败Llama2和Gemini Nano 2,microsoft,人工智能

要说 Phi-2，其最大的亮点就在于“小模型”+“高性能”，27 亿的参数量在现在成千上万亿参数的模型中显得格外亮眼，“模型小”将直接支持 Phi-2 可以在笔记本电脑、手机等移动设备上运行。

同时，划重点，“小模型”也可以支持科研人员在不需要昂贵计算设备的情况下在各个相关领域进行科学研究（妈妈再也不用担心实验室没有显卡啦）。

如下图所示，在BBH、常识推理、语言理解、数学、代码等多个领域，2.7B 的 Phi-2 都展现了超过 13B 的 Llama-2 与 7B 的 Mistral 的性能。甚至对比参数量相差近 25 倍的 70B Llama-2，在多个领域 Phi-2 都展现了接近甚至超越 Llama-2 的能力。

微软官宣放出一个「小模型」，仅2.7B参数，击败Llama2和Gemini Nano 2,microsoft,人工智能

而直接对标 Gemini Nano 2，哪怕参数量比 Gemini 少了五个亿，但是 Phi-2 也近乎全线优于 Gemini Nano 2。

微软官宣放出一个「小模型」，仅2.7B参数，击败Llama2和Gemini Nano 2,microsoft,人工智能

此外，在发布会中，微软 CEO 甚至对谷歌贴脸放大——什么？听说在谷歌的演示视频里 Gemini Ultra 可以解决物理问题，不好意思，我 2.7B 的模型 Phi-2 也可以。

微软官宣放出一个「小模型」，仅2.7B参数，击败Llama2和Gemini Nano 2,microsoft,人工智能

而如果更进一步向 Phi-2 输入错误的解题步骤与答案，Phi-2 也可以识别出错误并予以纠正。

微软官宣放出一个「小模型」，仅2.7B参数，击败Llama2和Gemini Nano 2,microsoft,人工智能

Phi-2 是微软之前调整的“微软喜欢小模型（SLM）”战略的产物，在今年 6 月，微软发布了一篇 “All You Need”格式的论文：《Textbooks Are All You Need》，使用了一种更加类似“编写高质量教科书让模型快速学习”的思想，使用高质量的教科书级的数据训练得到了仅仅 1.3 B 的“小模型” Phi-1，在多个评测数据集中取得了极高的正确率。

微软官宣放出一个「小模型」，仅2.7B参数，击败Llama2和Gemini Nano 2,microsoft,人工智能

延续这条“以数据为中心”的思路，微软陆续发布了 Ocra、Phi-1.5 等等在应用“数据管理”等技术训练的“小模型”，而 Phi-2 也正是这条技术进路的接续之作。

作为一个“小模型”，Phi-2 在 96 个 A100 GPU 上训练了 14 天，且没有使用 RLHF 进行对齐。但是，由于良好的数据质量与数据管理，Phi-2 在毒性方面仍然领先不少其他经过 RLHF 的模型。

微软官宣放出一个「小模型」，仅2.7B参数，击败Llama2和Gemini Nano 2,microsoft,人工智能

击败Gemini Ultra

除了 Phi-2 微软 cue 了谷歌 Gemini 以外，微软针对谷歌 Gemini 发布时所说的在“在 MMLU 基准测试中取得 SOTA”也展开了反击。在 Gemini 发布时，曾称 Gemini Ultra 以 90% 的正确率在大规模多任务语言理解数据集中击败 GPT-4 取得 SOTA。

微软官宣放出一个「小模型」，仅2.7B参数，击败Llama2和Gemini Nano 2,microsoft,人工智能

但是微软这两天反击称谷歌在发布信息时存在误导，Gemini Ultra 使用了更加复杂的 Prompt 形式，而如果仅仅使用标准的 Prompt，Gemini Ultra 的表现将比 GPT-4 差，而如果，GPT-4 使用前两天微软刚刚提出的 Medprompt 方法，那么就会击败 Gemini 获得一个新 SOTA：

微软官宣放出一个「小模型」，仅2.7B参数，击败Llama2和Gemini Nano 2,microsoft,人工智能

当然，emmmm 不过这个 90.1% 的新 SOTA 似乎有为了 SOTA 而 SOTA 之嫌，以 0.06% 的“巨大优势”击败谷歌（手动狗头）。

微软官宣放出一个「小模型」，仅2.7B参数，击败Llama2和Gemini Nano 2,microsoft,人工智能

除了 MMLU，微软还发布了其他基准测试的结果，使用简单的 Prompt 与 Gemini Ultra 的性能进行比较，GPT-4 也显著优于 Gemini Ultra：

微软官宣放出一个「小模型」，仅2.7B参数，击败Llama2和Gemini Nano 2,microsoft,人工智能

在这其中，微软使用的新的 Prompt 策略 Medprompt，最初是专为医疗垂直领域设计的 Prompt，通过集成“动态示例选择”，“自生成 CoT”以及“选择随机集成”方法，在医疗领域的多个数据集中取得了 SOTA。

微软官宣放出一个「小模型」，仅2.7B参数，击败Llama2和Gemini Nano 2,microsoft,人工智能

而其中，动态示例选择在于对于每个问题，选择之前收集得到的类似示例为模型提供上下文，而自生成 CoT 则从之前的训练数据中自动生成 CoT Prompt 加强模型的推理能力。最后选择随机集成以多数投票的方式选择最佳答案。

微软官宣放出一个「小模型」，仅2.7B参数，击败Llama2和Gemini Nano 2,microsoft,人工智能

在应用中，微软的研究人员逐渐发现这套思路不仅仅局限于医疗领域中，也适用于更加通用的任务之中，因此对标 Gemini Ultra 进行了一系列实验取得了良好的效果。

微软官宣放出一个「小模型」，仅2.7B参数，击败Llama2和Gemini Nano 2,microsoft,人工智能

看着这世界 AI 的两大巨头你来我往高手过招，你对标我我嘲讽你，对我们吃瓜群众来说倒也不失一场好戏，至于谷歌和微软在这场类似苏联和美国登月竞赛的对拼中谁能走的更远？大模型技术又能被他们推向什么样的高度，且就让我们静静等待吧！

微软官宣放出一个「小模型」，仅2.7B参数，击败Llama2和Gemini Nano 2,microsoft,人工智能文章来源地址https://www.toymoban.com/news/detail-760330.html

到了这里，关于微软官宣放出一个「小模型」，仅2.7B参数，击败Llama2和Gemini Nano 2的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

微软官宣裁员 10000 人。分享一些我的建议给大家
大家好！我是韩老师。昨天，西雅图双雄经历着不眠之夜。早些时间，就有传言说 1 月 18 日，亚马逊会裁员 18000 人。微软要裁员的各种消息也是满天飞。北京时间昨天晚上，微软官方博客发了一篇标题为 Focusing on our short- and long-term opportunity 的文章。其中，提及了裁员的
2024年02月10日
浏览(12)
LLMs：LLaMA Efficient Tuning(一款可高效微调【全参数/LoRA/QLoRA】主流大模型【ChatGLM2/LLaMA2/Baichuan等】的高效工具【预训练+指令监督微调+
LLMs：LLaMA Efficient Tuning(一款可高效微调【全参数/LoRA/QLoRA】主流大模型【ChatGLM-2/LLaMA-2/Baichuan等】的高效工具【预训练+指令监督微调+奖励模型训练+PPO 训练+DPO 训练】)的简介、安装、使用方法之详细攻略目录相关文章 LLMs之ChatGLM：ChatGLM Efficient Tuning(一款高效微调ChatGLM-6B/Ch
2024年02月09日
浏览(15)
我决定把一个收费视频课全免费公开了，今天起，慢慢放出“人人都需要的产品思维课”...
人人都需要的产品思维课 Version 2017 为什么这会儿公开，单纯因为版权到期了，可以公开了。咱也不靠这个挣钱，干脆免费给需要的人吧。这套课是2017年和馒头商学院合作录制的，所以内容主要基于2006~2014我在阿里做产品/管产品大学，以及2014~2017创业/孵化的经历所成。曾经
2023年04月08日
浏览(9)
LLM-分布式训练工具（一）：DeepSpeed【微软】【大模型分布式训练工具，实现ZeRO并行训练算法】【zero3配置将模型参数切分后分配到不同的显卡中，突破单张显卡容量不足以加载模型参数的限制】
DeepSpeed是微软推出的大规模模型分布式训练的工具，主要实现了ZeRO并行训练算法。原始文档链接： DeepSpeed Optimizer state partitioning (ZeRO stage 1) Gradient partitioning (ZeRO stage 2) Parameter partitioning (ZeRO stage 3) Custom mixed precision training handling A range of fast CUDA-extension-based optimizers ZeRO-Offlo
2024年02月16日
浏览(15)
Stability AI官宣Stable Code Instruct 3B模型，编程效率迎新突破｜TodayAI
刚刚出走CEO的Stability AI官宣了大模型Stable Code Instruct 3B，这个创新性大型语言模型吸引了编程和软件开发界的广泛关注。该模型基于Stable Code 3B开发，并通过自然语言提示，有效处理代码生成、数学解答以及其他与软件开发相关的查询任务。据了解，Stable Code Instruct 3B在3B规模
2024年04月13日
浏览(14)
基于Llama2模型的开源模型
2023年7月18日Meta开源了Llama2，在2万亿个Token上训练，可用于商业和研究，包括从7B到70B模型权重、预训练和微调的代码。相比Llama1，Llama2有较多提升，评估结果如下所示：基于Llama2模型的开源模型如下所示： 1.WizardCoder Python V1.0 2.Phind Code Llama v1 3.WizardLM 70B V1.0 4.Dophin Llam
2024年02月10日
浏览(9)
Python实现构建gan模型，输入一个矩阵和两个参数值，输出一个矩阵
构建一个GAN模型，使用Python实现，该模型将接受一个矩阵和两个参数值作为输入，并输出另一个矩阵。GAN（生成对抗网络）是一种深度学习模型，由生成器和判别器两部分组成，可以用于生成具有一定规律性的数据，如图像或音频。
2024年02月13日
浏览(6)
LLaMA 简介：一个基础的、650 亿参数的大型语言模型
目录 LLaMA Overview 概述 LlamaConfig class transformers.LlamaConfig LlamaTokenizer class transformers.LlamaTokenizer LlamaTokenizer
2024年02月10日
浏览(11)
ChatGPT模型大战：讯飞星火认知大模型、百度文心一言能否击败GPT-4（含个人内测体验测试邀请码获取方法，2小时申请成功，亲测有效）
科技领域的巨头科大讯飞5月6日在安徽省合肥市召开了一场盛大的发布会，正式发布了其最新的讯飞星火认知大模型，引起了广泛的关注和热议。据科大讯飞董事长刘庆峰和研究院院长刘聪介绍，目前该大模型已经在文本生成、知识问答、数学能力等三大能力上超越了ChatGPT，
2024年02月06日
浏览(10)
【LLM】LLaMA简介：一个650亿参数的基础大型语言模型
作为 Meta 对开放科学承诺的一部分，今天我们将公开发布 LLaMA (大型语言模型 Meta AI) ，这是一个最先进的大型语言基础模型，旨在帮助研究人员推进他们在人工智能这一子领域的工作。更小，更高性能的模型，例如 LLaMA，使得研究社区中没有大量基础设施的其他人能够研究这
2024年02月10日
浏览(10)