斯坦福2023【FrugalGPT】减少大模型的商业化应用成本

10月前作者：小小何先生分类：Toy博客阅读(59) 违法举报

这篇具有很好参考价值的文章主要介绍了斯坦福2023【FrugalGPT】减少大模型的商业化应用成本。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

FrugalGPT: How to Use Large Language Models While Reducing Cost and Improving Performance

主要解决问题

这篇文章主要是要解决如何降低调用大语言模型的成本(ChatGPT)。大模型API调用成本主要是三方面的：1. prompt cost(输入的prompt)；2. generation cost(输出的部分)；3. 每次调用的固定开销(网费等)。不用的模型之前的差异化收费也不一样，比如ChatGPT 10M的token需要30美金，但是如果是调用GPT-J的话，只需要0.2美金。

如何基于query的难易程度，来调用差异化的模型？如何将相似的问题存起来，减少模型的调用？等等一些手段都可以用来减少GPT的调用，减少成本。作者提出了三种策略来减少开销：

prompt adaptation；
LLM approximation；
LLM cascade；

结论就是能够减少98%的花销，或者是相同花销下，提升4%的性能。

采用什么方法

斯坦福2023【FrugalGPT】减少大模型的商业化应用成本

Prompt adaptation

LLM的调用开销与query的大小呈线性递增，因此减小prompt的长度就是一个可以去减少开销的点。

prompt selections：选择合适的，需要的QA示例：
query concatenation：多个query一起发送给chatgpt：

斯坦福2023【FrugalGPT】减少大模型的商业化应用成本

LLM approximation

如果大语言模型的调用很贵，那么一个简单的想法就是去近似这个大语言模型。不管是completion cache，还是fine-tuning都是可以的。

斯坦福2023【FrugalGPT】减少大模型的商业化应用成本

LLM cascade

不同的LLM APIs都具有他们各自的强项和弱项。

LLM cascade中两个比较关键的地方是：1. scoring function；2. LLM router。

斯坦福2023【FrugalGPT】减少大模型的商业化应用成本

在论文中，作者是采用DistiBERT去作为这个 scoring function。LLM router就是作者非常建议的设定这些阈值和顺序。当然这个也可以用大模型中的Reward Model去评分。

LLM的多样性同时会使得最终的性能有所提升，贵的LLM APIs也不一定见地好。

实验结论

作者在一些特定的数据集上面做了实验，以下是一些Cost和Acc的曲线图。可以看到很少的钱就能够达到较为不错的效果。

斯坦福2023【FrugalGPT】减少大模型的商业化应用成本

讨论与展望

这里很重要的一点，时间开销作者这里并没有讨论。尤其是LLM cascade这块，如果前两次调用失败，那时间开销就比较长了。当然还有一些问题是LLM商业化应用的共性问题，安全，隐私，伦理，不确定性等等。文章来源地址https://www.toymoban.com/news/detail-463208.html

到了这里，关于斯坦福2023【FrugalGPT】减少大模型的商业化应用成本的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

斯坦福发布最新 GPT 模型排行榜 AlpacaEval【AI工具免费使用】

官网地址：https://www.tomchat.fun 🤖 支持gpt4 / gpt-3.5 / claude /code-llm 🎨 支持 AI绘画 🆓 每天十次免费使用机会 🪄 无需魔法 GPT-4 登顶商用模型微软 WizardLM 登顶开源模型 AlpacaEva 是来自斯坦福的团队发布的一款大语言模型自动评测系统，它是一种基于 LLM 的全自动评估基准，且

2024年02月02日
浏览(59)
AI大模型额外学习一：斯坦福AI西部世界小镇笔记（包括部署和源码分析）

github链接 ①背景介绍 This repository accompanies our research paper titled “Generative Agents: Interactive Simulacra of Human Behavior.” It contains our core simulation module for generative agents—computational agents that simulate believable human behaviors—and their game environment. ②总体逻辑让小镇的NPC自由交流、开party、生

2024年04月28日
浏览(38)
大幅超越DALL·E 2和Imagen，斯坦福发布RA-CM3模型，融合检索与生成

文｜QvQ 最近，DALL-E和CM3等模型在多模态任务尤其是图文理解上表现出色。然而，这些模型似乎需要将所有学到的知识存储都存储在模型参数中，这就不得不需要越来越大的模型和训练数据来获取更多的知识，俨然将 bigger and better 绑定在了一起。那既然如此，哪还需要算法工

2024年02月09日
浏览(51)
大模型机器人发展史：从VoxPoser、RT2到斯坦福Mobile ALOHA、Google机器人

23年7月，我在朋友圈评估Google的RT2说道： “大模型正在革新一切领域啊，超帅，通过大模型不仅能理解“人话”，还能对“人话”进行推理，并转变为机器人能理解的指令，从而分阶段完成任务。回头仔细看下论文” 当时便对大模型机器人印象深刻，一直想仔细研究下来着

2024年02月02日
浏览(48)
斯坦福联合Meta提出多模态模型RA-CM3，检索增强机制或成文本图像领域新制胜法宝

原文链接：https://www.techbeat.net/article-info?id=4403 作者：seven_ 论文链接： https://arxiv.org/abs/2211.12561 相信目前很多AI大模型研究者都会遇到一个非常困难的问题，那就是很难控制的模型参数和容量，由于参与模型训练的数据量非常庞大，如果模型参数太少会导致过拟合，参数量过

2024年02月09日
浏览(43)
斯坦福人生设计课——简略笔记

来源：⽐尔 · 博内特戴夫 · 伊万斯著图书《人生设计课》目录一、认清当下的情况，从四个维度观察自己的人生二、平衡人生，但不要走入误区 2.1 记录你的“美好时光日志”： 2.1.1 记录内容： 2.1.2 辅助反思的方法：AEIOU方法 2.1.3 一个小TIPS： 2.1.4 如果你发现自己当下

2024年02月11日
浏览(45)
斯坦福用几百块钱训练的alpaca，体验一下基于llama的7b和13b模型，据说比gpt3.0还牛，结果怎样？？你能信？

好久没写代码了，上头了，强撸了！ 1、自己买个GPU服务器（如果不训练，可以随便买个高内存的即可），有些网站很便宜，小时起租！ 2、alpaca和模型下载地址：GitHub - antimatter15/alpaca.cpp: Locally run an Instruction-Tuned Chat-Style LLM git clone GitHub - antimatter15/alpaca.cpp: Locally run an Instr

2024年02月04日
浏览(51)
笔记汇总 | 斯坦福 CS229 机器学习

本文为斯坦福大学 CS229 机器学习课程学习笔记本文主体部分转载自黄海广博士，文末已给出链接，大家有兴趣可以直接访问笔记首页，下载对应课程资料及作业代码课程官网：CS229: Machine Learning (stanford.edu) 课程视频：Stanford CS229: Machine Learning Course, Lecture 1 - Andrew Ng (Autumn 2

2024年02月14日
浏览(42)
斯坦福JSKarel编程机器人使用介绍

为了避免被编程语言固有的复杂性所困扰，有一个被称为卡雷尔（Karel）机器人的微型世界（microworld）的简化环境，可以让编程初学者从中学习理解编程的基本概念，而不必掌握大量无关的细节，让编程初学者更容易理解编程的要点和思维方式。斯坦福Karel是一门面向初学者

2024年02月05日
浏览(45)
斯坦福人生设计课——简略笔记（未完待更新）

来源：⽐尔 · 博内特戴夫 · 伊万斯著图书《人生设计课》目录一、认清当下的情况，从四个维度观察自己的人生二、平衡人生，但不要走入误区 2.1 记录你的“美好时光日志”： 2.1.1 记录内容： 2.1.2 辅助反思的方法：AEIOU方法 2.1.3 一个小TIPS： 2.1.4 如果你发现自己当下

2024年02月11日
浏览(42)