AIGC(AI Generate Content)之改头换面——基于标题生成和摘要生成的内容创作方法

这篇具有很好参考价值的文章主要介绍了AIGC(AI Generate Content)之改头换面——基于标题生成和摘要生成的内容创作方法。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。


内容,已经成了我们生活中必不可少的成分,无论是小红书、抖音、爱奇艺等文本、短视频以及视频内容还是腾讯、网易的游戏内容。每天有不可计数的内容被生成,同时又被无数人的消费着,通过手机、电脑沉浸在一个个的 APP 中,用自己的时间、精力、金钱为各种内容买单。

内容的生产方式也是随着时代的变化在变化的,从最早的 PGC(Professionally Generated Content)到后来的 UGC(User Generated Content),以及现在逐渐火热的 AIGC(AI Generate Content),面对庞大的内容消费市场,我们如何通过 AIGC 的方式来进行内容生产呢?本文以文本内容为例,提供了一种思路,详情见正文,其他方法见后续文章。

AIGC(AI Generate Content)之改头换面——基于标题生成和摘要生成的内容创作方法


keywords: AIGC、摘要生成、文本生成、NLP、内容创作、AI创作

一、概述

一篇文本内容,一般有标题+正文的方式,正文通常是图文或者纯文本的形式。本文以纯文本为例。

生成思路:通过已有的原文数据,通过一定的手段,生成新的标题和正文数据

AIGC(AI Generate Content)之改头换面——基于标题生成和摘要生成的内容创作方法

巧妇难为无米之炊,创业还需要启动资金呢,我们至少有一批种子数据,而新内容是在已有的原文基础上进行的生成,
新内容的标题和正文,可以通过 NLP 中文本生成的方法获取,即标题生成和摘要生成。

摘要生成,一般包括抽取式和生成式,抽取式是从原文中抽取关键的句子组成摘要;生成式则是在理解原文的基础上进行语言的重新组织表达。很明显后者的难度要远大于前者。

二、过程

从上面我们知道,新内容我们拆分为了标题和正文的分别生成,那么,新内容的创作问题转换为了标题生成和正文生成的 NLP 生成问题了,
而这两个问题在 NLP 领域已经进行了深刻的研究并取得了不错的成果。

标题生成

标题生成可以看做是摘要生成的一个特例,相比摘要需要一定的长度和前后连贯性的要求,标题则需要新颖性、简短性的要求。两者的模型一般来说结构相同,训练数据格式也经常相同。

目前标题生成开源模型有:

  • tensorflow GPT2: https://github.com/liucongg/GPT2-NewsTitle
  • paddle Bert: https://aistudio.baidu.com/aistudio/projectdetail/3463042
  • paddle GPT2: https://aistudio.baidu.com/aistudio/projectdetail/2340166

基于公开的开源模型能够在通用数据集上得到一个较好的效果,但如果迁移到自己的领域,可能效果就不尽如人意,需要通过一定的微调实现领域知识的学习。

正文生成

新内容的正文,或者说摘要也是通过 NLP 生成模型来实现,但目前公开的模型,在中文数据集上,实验效果和实际效果存在一定的差异,或者说是数据集有效性,
目前效果比较好的几个摘要生成开源模型如下:

  • 科学空间: https://kexue.fm/archives/8046/comment-page-1
  • GPT2: https://zhuanlan.zhihu.com/p/113869509
  • GPT2: https://github.com/qingkongzhiqian/GPT2-Summary
  • bert: https://github.com/dmmiller612/bert-extractive-summarizer
  • bert: https://geek.digiasset.org/pages/nlp/nlpinfo/bert-text-summarizer-chinese/
  • tianma: https://github.com/google-research/pegasus
  • https://blog.csdn.net/c9Yv2cf9I06K2A9E/article/details/106893673

利用开源模型,或者进行微调后的开源模型,将原文转换为一定长度和描述的摘要,生成的摘要就可以当做新内容的正文啦。

三、分析

从上面的过程中,我们可以看出,生成的结果是两个模型结果的组合,并且两个模型都是压缩型的模型,将长文本转换为短文本,那么,相应的

  • 新内容的篇幅一定小于原文的长度,因为无论是标题还是摘要都是从原文中进行的概括总描述
  • 理论上,新内容的质量不高于原文,上限是原文的质量等级。

在做 NLP 生成模型中,标注数据的缺失是普遍遇到的问题。这需要一定的人力。

好啦,AIGC 方式进行内容生成的第一个方法就是这样啦,其他的方法,详见后续文章啦~

元宵节快乐~文章来源地址https://www.toymoban.com/news/detail-487892.html

到了这里,关于AIGC(AI Generate Content)之改头换面——基于标题生成和摘要生成的内容创作方法的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • AIGC绘画:基于Stable Diffusion进行AI绘图

    AIGC深度学习模型绘画系统 stable diffusion简介 Stable Diffusion是2022年发布的深度学习文本到图像生成模型,它主要用于根据文本的描述产生详细图像,尽管它也可以应用于其他任务,如内补绘制、外补绘制,以及在提示词(英语)指导下产生图生图的翻译。 Stable Diffusion主要用于

    2024年02月12日
    浏览(44)
  • AIGC(Artificial Intelligence Generated Content)和 Web3对比,未来发展

    历史背景 AIGC(Artificial Intelligence Generated Content)是指利用人工智能技术生成的内容。随着人工智能技术的不断发展,AIGC 行业逐渐兴起。早期的 AIGC 主要应用于自动化写作、新闻摘要生成等领域,随着技术的不断进步,AIGC 开始涉及更多的领域,如视频生成、图像生成、音频

    2024年02月14日
    浏览(27)
  • AI工智能讲师叶梓培训简历及提纲:AI人工智能之基于人工智能的内容生成(AIGC)简历提纲

    威信:amliy007 上海交通大学计算机专业博士毕业,高级工程师,高级程序员 主研方向:数据挖掘、机器学习、人工智能。 国内知名上市IT企业的AI技术总监、资深技术专家 一线人工智能经验(12年),大数据经验(8年),深度学习经验(5年) 在国内外期刊、会议中发表论文

    2024年02月10日
    浏览(51)
  • 基于 transformers 的 generate() 方法实现多样化文本生成:参数含义和算法原理解读

    最近在做文本生成,用到huggingface transformers库的文本生成 generate() 函数,是 GenerationMixin 类的实现( class transformers.generation_utils.GenerationMixin ),是自回归文本生成预训练模型相关参数的集大成者。因此本文解读一下这些参数的含义以及常用的 Greedy Search 、 Beam Search 、 Sampli

    2024年02月02日
    浏览(36)
  • AIGC革新,将文字或者LOGO融入AI视频基于PIKA-labs(Python3.10)

    很多平台都会禁止用户使用带有网址或者二维码的头像以及文章配图,这样可以有效的防止用户的一些“导流”行为。当然,头像、文章或者视频现在都是AI来审,毕竟现在人工的成本实在太高,但是如果我们把文字元素直接融入图像或者视频之中,如此一来,AI也会很难识别

    2024年02月08日
    浏览(26)
  • Azure AI 内容安全Content Safety Studio实战

    Azure AI Content Safety 检测应用程序和服务中用户生成和 AI 生成的有害内容。 Azure AI 内容安全包括文本和图像 API,可用于检测有害材料。 交互式 Content Safety Studio,可用于查看、浏览和试用用于检测不同形式的有害内容的示例代码。 关注TechLead,分享AI全维度知识。作者拥有10

    2024年02月03日
    浏览(31)
  • 基于内容的推荐算法(Content-Based)

    简介 基于内容的推荐方法是非常直接的,它以物品的内容描述信息为依据来做出的推荐,本质上是基于对物品和用户自身的特征或属性的直接分析和计算。 内容推荐算法是指在网站或应用中向用户推荐内容的一种机器学习算法。这些算法通过分析用户的历史浏览记录、搜索

    2024年02月04日
    浏览(27)
  • 认识 AIGC ,浅淡 AIGC 的那些事—— AIGC:用 AI 创造万物

    关注 AIGC 、人工智能绘画方面的博友们,应该很快就认出了这幅画吧,没错这就是 AIGC 的产物,由新型 AI 绘画工具 “Midjourney” 创作而成,名为《太空歌剧院》。 《太空歌剧院》是一幅神奇的画作,它结合了古典与科幻的元素,将17世纪欧洲的歌剧院场景与极具科幻的太空相

    2024年02月08日
    浏览(66)
  • (十三)AI作画、AI绘画、AIGC本地大模型

    AI作画近期很火,涌现出了很多AIGC(AI内容生成)的网站、平台,但这些平台都是使用的云上的算力,基本都有使用的各种限制等。 一、本代码自动将大模型下载本地,可以无-限-使-用。但是对硬件的要求较高需要8G显存以上的显卡才能快速出图,用CPU会很慢的。 【同时,针对

    2024年02月11日
    浏览(41)
  • AI绘画升温、AI写作降温,AIGC玩“变脸”

    配图来自Canva可画 自柯洁在“围棋人机大战”中惜败AlphaGo后,AI再次上演打败艺术家的戏码,AIGC(人工智能自主生成内容)时代真的要来了吗? 据了解,在今年科罗拉多州博览会艺术竞赛中,一名叫艾伦的参赛者利用AI绘图工具Midjourney完成的绘画作品,拿下了博览会的数位

    2024年02月13日
    浏览(31)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包