【精华】AIGC之大语言模型及实践应用

这篇具有很好参考价值的文章主要介绍了【精华】AIGC之大语言模型及实践应用。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

AIGC之大语言模型及实践应用

(一)大语言模型(LLM)
  • IDEA-CCNL/Taiyi-Stable-Diffusion-1B-Chinese-v0.1 · Hugging Face

    首个开源的中文Stable Diffusion模型,基于0.2亿筛选过的中文图文对训练。

  • LianjiaTech/BELLE: BELLE: Be Everyone’s Large Language model Engine

    BELLE: BE Large Language model Engine[知乎]
    开源中文对话大模型70 亿参数的 BELLE(Bloom-Enhanced Large Language model Engine)基于斯坦福的 Alpaca 完成,并进行了中文优化,对生成代码进行了修改,不仅如此,模型调优仅使用由 ChatGPT 生产的数据(不包含任何其他数据)。

  • 中文对话式大语言模型Firefly-2b6开源,使用210万训练数据
    Github:Firefly: Firefly(流萤): 中文对话式大语言模型 (github.com)

  • AutoGPT太火了,无需人类插手自主完成任务,GitHub2.7万星
    Github:Auto-GPT: An experimental open-source attempt to make GPT-4 fully autonomous. (github.com)

  • Stability AI新开源Stable Diffusion姊妹模型StableLM:正式入局语言大模型
    Github: https://github.com/stability-AI/stableLM/

  • 清华AIR开源轻量版BioMedGPT!聂再清:最终目标是生物医药领域基础大模型
    Github: https://github.com/BioFM/OpenBioMed

  • Chinese-Vicuna 中文小羊驼
    GitHub: https://github.com/Facico/Chinese-Vicuna

  • Chinese-LLaMA-Alpaca:优秀的开源中文语言模型预训练工具
    GitHub: https://github.com/ymcui/Chinese-LLaMA-Alpaca

(二)实践应用
(1)ChatGPT

​ 美国OpenAI研发的聊天机器人程序,于2022年11月30日发布。ChatGPT是人工智能技术驱动的自然语言处理工具,它能够通过理解和学习人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码,写论文等任务。

官网:Introducing ChatGPT (openai.com)

(2)百度:文心一言

​ 百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动回答问题协助创作,高效便捷地帮助人们获取信息]、知识和灵感。文心一言是知识增强的大语言模型,基于飞桨深度学习平台和文心知识增强大模型,持续从海量数据和大规模知识中融合学习具备知识增强、检索增强和对话增强的技术特色

官网: 文心大模型

相关链接:文心大模型-产业级知识增强大模型

(3)阿里:通义千问

​ 阿里云推出的一个超大规模的语言模型,功能包括多轮对话、文案创作、逻辑推理、多模态理解、多语言支持。能够跟人类进行多轮的交互,也融入了多模态的知识理解,且有文案创作能力,能够续写小说,编写邮件等。

阿里正式发布“通义千问”大模型,电商行业进入AI时代

官网: 通义千问

(4)商汤:日日新SenseNova

​ 商汤科技宣布推出的大模型体系,包括自然语言处理模型“商量”(SenseChat)、文生图模型“秒画”和数字人视频生成平台“如影”(SenseAvatar)等。

商汤ChatGPT「商量」炸场!秒生6K神图,代码提速62%,现场直播怼脸

官网: 日日新SenseNova

(5)科大讯飞:星火认知大模型

科大讯飞发布讯飞“星火”认知大模型,并同步推出面向教育、办公、车载等行业的解决方案。“星火”大模型可以连贯回答记者提出的问题,完成写文章、作诗、编写代码等任务,并在记者提出的部分“诱导性”问题上成功避坑。不过,作为人工智能模型,“星火”也不可避免的存在“幻觉”现象,其虽然能够理解记者提出的一些高难度问题并可以给出回答,但对一些偏小众的问题会生成不够准确的回答,且其回答无法涵盖近期的新闻事件。此外,目前“星火”不支持文生图功能。

实测科大讯飞大模型“星火”:多轮对话能写代码 还将迭代三轮

官网: 讯飞星火认知大模型文章来源地址https://www.toymoban.com/news/detail-487919.html

(三)研究进展
  • 开源大语言模型汇总
  • A brief history of LLaMA models - AGI Sphere (agi-sphere.com)
  • LLaMA模型简史_哔哩
  • 碾压LLaMA,「猎鹰」彻底开源!400亿参数,万亿token训练,霸榜Hugging Face
  • RWKV的在线体验网址出来啦!作者亲自教学,效果超棒!
  • Anthropic发布Claude2,它能颠覆OpenAI的统治吗?

到了这里,关于【精华】AIGC之大语言模型及实践应用的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 关于语言模型私有化部署的讨论 | AIGC实践

    上周在与TC同行关于AIGC实践的线上交流中,大家普遍比较关心的一个实践切入点是:语言模型的私有化部署——简单来说,就是在企业内部,部署一个属于自己的“ChatGPT”,对于本行业/专业知识,以及企业独有的产品和技术信息有充分的了解,并且提供用户接口,通过自然

    2024年02月11日
    浏览(63)
  • 大语言模型在推荐系统的实践应用

    本文从应用视角出发,尝试把大语言模型中的一些长处放在推荐系统中。 01 背景和问题 传统的推荐模型网络参数效果较小(不包括embedding参数),训练和推理的时间、空间开销较小,也能充分利用用户-物品的协同信号。但是它的缺陷是只能利用数据集内的知识,难以应用open

    2024年02月07日
    浏览(33)
  • 自然语言处理的革命:AI大模型在AIGC领域的应用

    自然语言处理(NLP)是人工智能(AI)领域的一个重要分支,其主要关注于计算机理解、生成和处理人类语言。自从2012年的深度学习革命以来,NLP 领域的研究取得了巨大进展,尤其是在自然语言生成和机器翻译等方面。然而,直到2020年,GPT-3等大型语言模型的出现,NLP 领域

    2024年02月03日
    浏览(50)
  • 破局之作:首部开源 AIGC 软件工程应用电子书《构筑大语言模型应用:应用开发与架构设计》...

    TL;DR 版; 在线:https://aigc.phodal.com 下载 1:https://github.com/phodal/aigc/releases 下载 2:https://pan.baidu.com/s/1wGc75vVHaZwvZyHeltyt8w?pwd=phod 2023 年的上半年里,我(@phodal)和 Thoughtworks 的同事们(如:@tianweiliu、@teobler、@mutoe 等)、 开源社区的同伴们(如:卷王@CGQAQ、@genffy、 @liruifengv 等

    2024年02月15日
    浏览(47)
  • R语言的贝叶斯时空数据模型实践技术应用

    时间-空间数据(以下简称“时空数据”)是最重要的观测数据形式之一,很多科学研究的数据都以时空数据的形式得以呈现,而科学研究目的可以归结为挖掘时空数据中的规律。另一方面,贝叶斯统计学作为与传统统计学并列的方法,在现今的科学研究中占据了重要的地位

    2024年02月01日
    浏览(54)
  • R语言APSIM模型进阶应用与参数优化、批量模拟实践技术

    随着数字农业和智慧农业的发展,基于过程的农业生产系统模型在模拟作物对气候变化的响应与适应、农田管理优化、作物品种和株型筛选、农田固碳和温室气体排放等领域扮演着越来越重要的作用。APSIM (Agricultural Production Systems sIMulator)模型是世界知名的作物生长模拟模型之

    2024年02月12日
    浏览(44)
  • 基于大语言模型知识问答应用落地实践 – 知识库构建(下)

    上篇介绍了构建知识库的大体流程和一些优化经验细节,但并没有结合一个具体的场景给出更细节的实战经验以及相关的一些 benchmark 等,所以本文将会切入到一个具体场景进行讨论。 目标场景:对于 PubMed 医疗学术数据中的 1w 篇文章进行知识库构建,实现快速的注入和查

    2024年02月10日
    浏览(48)
  • 构建企业级大语言模型应用的秘诀:GitHub Copilot 的实践之路

    GitHub Copilot 的开发团队分享了他们在构建能够同时为个人和企业用户带来价值的大语言模型(LLM)应用的心得体会。 本文经授权转载宝玉老师的个人博客(微博@宝玉xp),链接:https://baoyu.io/translations/llm/how-to-build-an-enterprise-llm-application-lessons-from-github-copilot 责编 | 夏萌 出处

    2024年02月04日
    浏览(45)
  • 【精华】AIGC之Stable Diffusion专栏

    【精华】AIGC之Stable Diffusion专栏 Stable-diffusion-webui 小白使用大全+插件和模型推荐2.0 Stable-diffusion-webui 插件拓展及依赖汇总 (1)openpose editor(♥♥♥♥♥) 【AI绘画】使用OpenPose editor打造个性化的人物姿势绘画 GitHub地址 :https://github.com/fkunn1326/openpose-editor GitHub地址 :https:/

    2024年02月11日
    浏览(45)
  • AIGC生成3D模型探索与实践

    本文将以AIGC生成3D模型探索与实践为主题,结合电商平台的应用需求,探讨如何利用AIGC技术实现3D模型的个性化生成、大规模生产和快速推广,以及其对于电商行业的推动作用。 背景 随着电商平台的兴起,3D模型已经成为展示商品的重要手段,手机天猫正在积极探索3D相关

    2024年02月05日
    浏览(37)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包