当前各大电商互联网平台上拥有海量的商品数据,为商品撰写一个精准且具有吸引力的标题文案,对于业务场景的转化以及用户使用体验的提升都有极大帮助。然而由于商品库规模庞大,人工运营编写商品文案的成本太高,并且对于智能推荐、营销等需要及时动态展示的场景,全部采用人工来编写多样化、个性化的文案基本是不现实的。因此,基于机器智能的文案生成技术,对于成本控制,以及大规模动态文案生成场景,不失为一种高效的解决方案。
机器智能文案生成技术虽然被业界广泛研究并在特定场景得到深入的应用,但依然是充满挑战的一项任务。尤其对于电商标题文案生成来说,智能生成的文案不能太过自由、超纲发挥,至少需要满足 2 点条件:文案准确地陈述商品的真实属性、文案包含了商品重要信息、文案能够突出显示商品的特色亮点;除此之外我们还希望文案具有阅读流畅、文采、吸引用户等加分项。总之,对于电商标题文案生成任务,首先需要依赖一套可控的文案生成技术、保证文案的准确全面,其次需要依赖外部知识、使得生成文案更具吸引力和多样性。随着近年来超大规模语言模型(LLM)不断取得了新的进展、突破,为我们解决电商标题文案生成任务提供了诸多的启发,借助 LLM 预训练模型内部的世界知识、再结合前沿的 ChatGPT 模型训练手段,极大的提升了文案生成效果。
在超大规模语言模型(LLM)阵营中 OpenAI 发布的 GPT 系列模型有着举足轻重的地位,模型参数规模从 GPT-1 的亿级别提升到 GPT-3 的千亿级、训练数据也相应地从 GB 级别提升到了 TB 级别,并且发布于 2020 年的 GPT-3 展现出来的零/少样本学习能力,能够广泛的适用于各种自然语言理解和生成任务,在当时让整个社区大为震撼。临近 2022 年末,OpenAI 发布了对话场景下的 ChatGPT,再次震撼社区、大量用户涌入试用、在社交媒体上传阅讨论相关话题,仅一周时间注册用户就突破百万,可见 ChatGPT 带来的影响力之大。在感慨 LLM 突飞猛进的同时,作为技术同学,我们一直在思考 ChatGPT 这种前沿的技术进步能够为我们真实的业务场景带来什么启示。随着对 ChatGPT、InstructGPT 以及基于人类反馈的强化学习(RLHF)等技术的了解,我们发现 ChatGPT 的对话场景和电商标题文案场景具有诸多相似之处,ChatGPT 的重要动机在于让模型生成内容不是随意发挥、而是对齐人类偏好,而前面提到电商标题文案也有这类诉求,因此我们探索将 ChatGPT 部分模型训练优化思路借鉴过来解决可控文案生成问题。
接下来本文将会详细介绍如何借鉴 ChatGPT 模型训练优化思路的方法、展示效果上带来的提升以及对未来的一些规划展望。另外虽然本文将会以酒店民宿场景下的标题文案生成为例,但其实方法具有场景普适性,适合大多数具有可控诉求的商品标题文案生成问题。
方法
问题定义
本文将以酒店民宿场景下的标题文案生成为例,来介绍如何借鉴 ChatGPT 模型训练优化的思路。该问题具体来说,就是给定房源的结构化和非结构化信息(其中结构化包括房型/风格/配套设施等,非结构化信息包括房东描述/周边介绍等),生成描述房源对应的标题,要求标题能够客观且全面的展现房源真实信息并能够突出房源特色亮点。文章来源:https://www.toymoban.com/news/detail-437567.html
整套房源标题文案生成的核心流程如下所示:文章来源地址https://www.toymoban.com/news/detail-437567.html
到了这里,关于ChatGPT 助力智能文案生成的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!