Prompt本质解密及Evaluation实战与源码解析(一)

1年前作者：段智华分类：Toy博客阅读(4)违法举报

这篇具有很好参考价值的文章主要介绍了Prompt本质解密及Evaluation实战与源码解析(一)。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

第9章 Prompt本质解密及Evaluation实战与源码解析
9.1 Customer Service案例
本节主要谈提示词（Prompt）内部的工作机制，围绕案例、源码、论文三个维度展开。首先，我们可以看一下代码部分，这是对基于大模型应用程序开发的一个评估（Evaluation），这显然是一个至关重要的内容。大家做所有基于机器学习的模型，或者所有NLP的项目，对应用程序的评估是一个核心性的东西，因为程序的版本升级或者迭代，需对程序的表现进行评估，提供一些基本的数据，但是对大模型的评估，它跟传统的机器学习不太一样，尤其是基于GPT系列或者生成语言模型，因为它生成的内容，和传统经典意义上的基于内容和标签进行评估，不太完全一样。
Gavin大咖微信：NLP_Matrix_Space
OpenAI官方提供了一些指导，DeepLearning.AI借助OpenAI的一些指导思想，提出了对结果评估的一些具体步骤，我们来看一下，DeepLearning.AI提供的示例中，它的提示词写的非常经典，第一是因为它有效，第二是其他很多开源框架和产品中，都会有类似的实现或者类似的提示词。文章来源地址https://www.toymoban.com/news/detail-551710.html

1.	def eval_with_rubric(test_set, assistant_answer

到了这里，关于Prompt本质解密及Evaluation实战与源码解析(一)的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：如若内容造成侵权/违法违规/事实不符，请点击违法举报进行投诉反馈，一经查实，立即删除！

分享到：

领支付宝红包赞助服务器费用

Spring Cloud 实战 | 解密Feign底层原理，包含实战源码
专栏集锦，大佬们可以收藏以备不时之需 Spring Cloud实战专栏：https://blog.csdn.net/superdangbo/category_9270827.html Python 实战专栏：https://blog.csdn.net/superdangbo/category_9271194.html Logback 详解专栏：https://blog.csdn.net/superdangbo/category_9271502.html tensorflow专栏：https://blog.csdn.net/superdangbo/category_869
2024年02月06日
浏览(8)
Go泛型解密：从基础到实战的全方位解析
本篇文章深入探讨了Go语言的泛型特性，从其基础概念到高级用法，并通过实战示例展示了其在实际项目中的应用。关注【TechLeadCloud】，分享互联网架构、云服务技术的全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验，同济本复旦硕，复旦机器人
2024年02月08日
浏览(10)
Spring Cloud 实战 | 解密负载均衡Ribbon底层原理，包含实战源码
专栏集锦，大佬们可以收藏以备不时之需 Spring Cloud实战专栏：https://blog.csdn.net/superdangbo/category_9270827.html Python 实战专栏：https://blog.csdn.net/superdangbo/category_9271194.html Logback 详解专栏：https://blog.csdn.net/superdangbo/category_9271502.html tensorflow专栏：https://blog.csdn.net/superdangbo/category_869
2024年02月08日
浏览(8)
LLMs：《A Survey on Evaluation of Large Language Models大型语言模型评估综述》理解智能本质(具备推理能力)、AI评估的重要性(识别当前算法的局限性+设
LLMs：《A Survey on Evaluation of Large Language Models大型语言模型评估综述》翻译与解读导读：该文章首先介绍了人工智能（AI）对机器智能的专注，并探讨了评估AI模型的方法。随后，重点介绍了大语言模型（LLMs）的背景和特点，以及它们在自然语言处理、推理、生成等各类任务中
2024年02月03日
浏览(14)
【Python爬虫项目实战二】Chatgpt还原验证算法-解密某宝伪知网数据接口
最近在写论文，导师那里很严格，所以我打算去知网下载文章进行参考，但是需要money，在同学的推荐下拿到了某宝一家免费的知网接口，今天就是对该网站的分析，最后成品会开源！在分析的时候被对方耍了一下，对方有一个登陆页面，登陆了后才发现只是个导航，其实登
2023年04月22日
浏览(24)
最新AI创作系统/AI绘画系统/ChatGPT系统+H5源码+微信公众号版+支持Prompt应用
SparkAi创作系统是基于国外很火的ChatGPT进行开发的AI智能问答系统和AI绘画系统。本期针对源码系统整体测试下来非常完美，可以说SparkAi是目前国内一款的ChatGPT对接OpenAI软件系统。那么如何搭建部署AI创作ChatGPT？小编这里写一个详细图文教程吧！SparkAi程序使用Nestjs和Vue3框架技
2024年02月08日
浏览(9)
ChatGPT中文版Prompt提示工程超详细指南《提示工程简介及示例》Github最新破万星项目Meta AI前工程师解密百万年薪提示工程师GPT-4模型优化利器（一）
近期，Meta AI前工程师推出的最强辅助——提示工程师指南在Github上引起了极大的反响。这份全面指南详细列出了提示工程师所需的所有资料，使得他们在开发过程中拥有更多的技巧。这份指南提供的信息十分丰富，覆盖了从提示技巧使用到提示应用等各个方面，甚至还提供
2024年02月02日
浏览(15)
最新AI创作系统ChatGPT源码+搭建部署教程+支持GPT4.0+支持ai绘画（Midjourney)/支持Prompt
SparkAi创作系统是基于OpenAI很火的ChatGPT进行开发的Ai智能问答系统+AI绘画系统，支持 OpenAI GPT全模型+国内AI全模型。本期针对源码系统整体测试下来非常完美，可以说SparkAi是目前国内一款的ChatGPT对接OpenAI软件系统。那么如何搭建部署AI创作ChatGPT？小编这里写一个详细图文教程
2024年02月08日
浏览(40)
AI创作系统ChatGPT网站源码/支持DALL-E3文生图/支持最新GPT-4-Turbo模型+Prompt应用
SparkAi创作系统是基于OpenAI很火的ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统，支持OpenAI-GPT全模型+国内AI全模型。本期针对源码系统整体测试下来非常完美，可以说SparkAi是目前国内一款的ChatGPT对接OpenAI软件系统。那么如何搭建部署AI创作ChatGPT？小编这里写一个详细图
2024年02月05日
浏览(37)
最新SparkAI创作系统V2.6.2/ChatGPT网站系统H5源码+微信公众号版+AI绘画系统源码/支持GPT联网提问/支持Prompt应用
SparkAi创作系统是基于国外很火的ChatGPT进行开发的AI智能问答系统和AI绘画系统。本期针对源码系统整体测试下来非常完美，可以说SparkAi是目前国内一款的ChatGPT对接OpenAI软件系统。那么如何搭建部署AI创作ChatGPT？小编这里写一个详细图文教程吧！SparkAi程序使用Nestjs和Vue3框架技
2024年02月08日
浏览(36)