微软近日推出了Phi-2,这是一款小型语言模型,但其性能却十分强大

这篇具有很好参考价值的文章主要介绍了微软近日推出了Phi-2,这是一款小型语言模型,但其性能却十分强大。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

来这里看看: https://huggingface.co/microsoft/phi-2

当我们谈论与生成性人工智能(AI)相关的语言模型时,我们通常首先想到的是大型语言模型(LLM),这些模型驱动了大多数流行的聊天机器人,例如ChatGPT、Bard和Copilot。然而,微软的新型语言模型Phi-2展示了小型语言模型(SLM)在生成性AI领域也有巨大的潜力。

微软于周三发布了Phi-2,这是一款能够进行常识推理和语言理解的小型语言模型,现已在Azure AI Studio模型目录中提供。尽管Phi-2被称为“小型”,但它在模型中包含了27亿参数,远超过Phi-1.5的13亿参数。Phi-2在不到130亿参数的语言模型中展现了“最先进的性能”,甚至在复杂基准测试中超越了规模大25倍的模型。Phi-2在多个不同的基准测试中超越了包括Meta的Llama-2、Mistral以及谷歌的Gemini Nano 2在内的模型,Gemini Nano 2是谷歌最强大LLM的最小版本。

phi-2 安装,语言模型,人工智能,自然语言处理

Phi-2的性能结果与微软开发具有突破性能力和与大规模模型相当性能的SLM的目标一致。

微软在训练Phi-2时非常挑剔地选择了数据。公司首先使用了所谓的“教科书质量”数据。微软随后通过添加精心挑选的网络数据来增强语言模型数据库,这些数据在教育价值和内容质量上经过了筛选。

那么,为什么微软专注于SLM?

SLM是LLM的一种成本效益较高的替代品。在不需要LLM的强大能力来完成任务时,较小的模型也很有用。

此外,运行SLM所需的计算能力远低于LLM。这种降低的要求意味着用户不必投资昂贵的GPU来满足他们的数据处理需求。文章来源地址https://www.toymoban.com/news/detail-763302.html

到了这里,关于微软近日推出了Phi-2,这是一款小型语言模型,但其性能却十分强大的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • AI大模型日报#0424:全球首个AI基因编辑器、出门问问上市、微软开源Phi-3 Mini、昆仑万维年收49亿

    导读: 欢迎阅读《AI大模型日报》,内容基于Python爬虫和LLM自动生成。目前采用“文心一言”生成了每条资讯的摘要。 标题: 爱诗科技完成A2轮超亿元融资,蚂蚁集团领投 摘要:  爱诗科技完成A2轮超亿元融资,成为视频大模型领域融资规模最大的中国创业公司。其视频生成产

    2024年04月25日
    浏览(64)
  • 比亚迪发布璇玑AI大模型;微软推出Copilot Pro;国内首个MoE模型上线

    比亚迪发布璇玑 AI 大模型 1 月 16 日,在 2024 比亚迪梦想日活动上,比亚迪正式发布了整车智能化架构「璇玑」及「璇玑 AI 大模型」。 比亚迪产品规划及汽车新技术研究院院长杨冬生称,「璇玑」是行业首个智电融合的智能化架构,让汽车拥有了智能化的「大脑」和「神经网

    2024年01月18日
    浏览(62)
  • 【用友】关于近日微软吊销证书导致用友/金蝶软件无法使用问题及解决办法

    问题现象: 2023年8月23日,用友/金蝶用户大批量出现无法正常使用的情况,用友T3/T6服务无法启动,有的是在使用中频繁报错,如下图: 金蝶部分版本提示如下:  经过开发排查,发现是微软吊销了win10和win11上的verisign证书,导致程序证书签名失效无法正常使用。   受影响的

    2024年02月01日
    浏览(62)
  • 聊聊transformers库; 微软推出ZeRO++技术:优化大型AI模型训练时间和成本

    🦉 AI新闻 🚀 微软推出ZeRO++技术:优化大型AI模型训练时间和成本 摘要 :据报道,微软研究人员最近发布了一项名为ZeRO++的新技术,旨在优化训练大型AI模型时常遇到的数据传输成本和带宽限制问题,可大幅减少训练时间和成本。ZeRO++建立在现有的ZeRO传输技术基础上,并通

    2024年02月13日
    浏览(59)
  • 只有27亿参数,性能却高25倍!微软发布Phi-2

    12月13日,微软在官方网站正式发布了,27亿参数的大语言模型—Phi-2。 Phi-2是基于微软的Phi-1.5开发而成,可自动生成文本/代码、总结文本、数学推理等功能。 虽然Phi-2的参数很小,性能却优于130亿参数的Llama-2和70亿参数的Mistral,以及谷歌最新发布的Gemini Nano 2。 值得一提的是

    2024年02月04日
    浏览(38)
  • 微软等开源评估ChatGPT、Phi、Llma等,统一测试平台

    微软亚洲研究院、中国科学院自动化研究所、中国科学技术大学和卡内基梅隆大学联合开源了,用于评估、分析大语言模型的统一测试平台——PromptBench。 Prompt Bench支持目前主流的开源、闭源大语言模型,例如,ChatGPT、GPT-4、Phi、Llma1/2、Gemini、Baichuan、Yi 等。 PromptBench内置了

    2024年01月21日
    浏览(34)
  • 这是一款关于网页自动化操作的软件

    有开发这款软件的想法是因为工作中有部分任务重复性太多,作为开发工程师,一开始自己写了脚本完成了这些任务。换个思路,各行各业中也会遇到重复性工作,但是并不是每个人都会开发,那本人就想有没有一种软件也可以让不懂开发的人也可以实现自动化工作。于是,

    2024年01月21日
    浏览(42)
  • Meta 推出的 LLaMA 大语言模型部署教程

    简介: LLaMA(Lager Language Model From Meta),这是一个从7B到65B参数的基础语言模型的集合。它在数万亿的文本tokens上训练的模型,并表明在不求助于专有和不可访问的数据集,而仅使用公开的数据集来训练最先进的模型是可能的。特别是, LLaMA-13B 在大多数基准测试上优于GPT-3(

    2024年02月06日
    浏览(42)
  • 亚马逊宣布推出Rufus,这是一种新的由生成式AI驱动的对话式购物体验

      深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/ 。  亚马逊今天宣布推出Rufus,一款基于生成式人工智能

    2024年02月20日
    浏览(57)
  • Phi-2小语言模型QLoRA微调教程

    就在不久前,微软正式发布了一个 27 亿参数的语言模型——Phi-2。这是一种文本到文本的人工智能程序,具有出色的推理和语言理解能力。同时,微软研究院也在官方 X 平台上声称:“Phi-2 的性能优于其他现有的小型语言模型,但它足够小,可以在笔记本电脑或者移动设备上

    2024年01月16日
    浏览(42)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包