AIGC之大语言模型及实践应用
(一)大语言模型(LLM)
-
IDEA-CCNL/Taiyi-Stable-Diffusion-1B-Chinese-v0.1 · Hugging Face
首个开源的中文Stable Diffusion模型,基于0.2亿筛选过的中文图文对训练。
-
LianjiaTech/BELLE: BELLE: Be Everyone’s Large Language model Engine
BELLE: BE Large Language model Engine[知乎]
开源中文对话大模型70 亿参数的 BELLE(Bloom-Enhanced Large Language model Engine)基于斯坦福的 Alpaca 完成,并进行了中文优化,对生成代码进行了修改,不仅如此,模型调优仅使用由 ChatGPT 生产的数据(不包含任何其他数据)。 -
中文对话式大语言模型Firefly-2b6开源,使用210万训练数据
Github:Firefly: Firefly(流萤): 中文对话式大语言模型 (github.com) -
AutoGPT太火了,无需人类插手自主完成任务,GitHub2.7万星
Github:Auto-GPT: An experimental open-source attempt to make GPT-4 fully autonomous. (github.com) -
Stability AI新开源Stable Diffusion姊妹模型StableLM:正式入局语言大模型
Github: https://github.com/stability-AI/stableLM/ -
清华AIR开源轻量版BioMedGPT!聂再清:最终目标是生物医药领域基础大模型
Github: https://github.com/BioFM/OpenBioMed -
Chinese-Vicuna 中文小羊驼
GitHub: https://github.com/Facico/Chinese-Vicuna -
Chinese-LLaMA-Alpaca:优秀的开源中文语言模型预训练工具
GitHub: https://github.com/ymcui/Chinese-LLaMA-Alpaca
(二)实践应用
(1)ChatGPT
美国OpenAI研发的聊天机器人程序,于2022年11月30日发布。ChatGPT是人工智能技术驱动的自然语言处理工具,它能够通过理解和学习人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码,写论文等任务。
官网:Introducing ChatGPT (openai.com)
(2)百度:文心一言
百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息]、知识和灵感。文心一言是知识增强的大语言模型,基于飞桨深度学习平台和文心知识增强大模型,持续从海量数据和大规模知识中融合学习具备知识增强、检索增强和对话增强的技术特色
官网: 文心大模型
相关链接:文心大模型-产业级知识增强大模型
(3)阿里:通义千问
阿里云推出的一个超大规模的语言模型,功能包括多轮对话、文案创作、逻辑推理、多模态理解、多语言支持。能够跟人类进行多轮的交互,也融入了多模态的知识理解,且有文案创作能力,能够续写小说,编写邮件等。
阿里正式发布“通义千问”大模型,电商行业进入AI时代
官网: 通义千问
(4)商汤:日日新SenseNova
商汤科技宣布推出的大模型体系,包括自然语言处理模型“商量”(SenseChat)、文生图模型“秒画”和数字人视频生成平台“如影”(SenseAvatar)等。
商汤ChatGPT「商量」炸场!秒生6K神图,代码提速62%,现场直播怼脸
官网: 日日新SenseNova
(5)科大讯飞:星火认知大模型
科大讯飞发布讯飞“星火”认知大模型,并同步推出面向教育、办公、车载等行业的解决方案。“星火”大模型可以连贯回答记者提出的问题,完成写文章、作诗、编写代码等任务,并在记者提出的部分“诱导性”问题上成功避坑。不过,作为人工智能模型,“星火”也不可避免的存在“幻觉”现象,其虽然能够理解记者提出的一些高难度问题并可以给出回答,但对一些偏小众的问题会生成不够准确的回答,且其回答无法涵盖近期的新闻事件。此外,目前“星火”不支持文生图功能。
实测科大讯飞大模型“星火”:多轮对话能写代码 还将迭代三轮文章来源:https://www.toymoban.com/news/detail-487919.html
官网: 讯飞星火认知大模型文章来源地址https://www.toymoban.com/news/detail-487919.html
(三)研究进展
- 开源大语言模型汇总
- A brief history of LLaMA models - AGI Sphere (agi-sphere.com)
- LLaMA模型简史_哔哩
- 碾压LLaMA,「猎鹰」彻底开源!400亿参数,万亿token训练,霸榜Hugging Face
- RWKV的在线体验网址出来啦!作者亲自教学,效果超棒!
- Anthropic发布Claude2,它能颠覆OpenAI的统治吗?
到了这里,关于【精华】AIGC之大语言模型及实践应用的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!