目录
AIGC发展概览
AIGC发展的重要里程碑事件
媒体平台AIGC功能
媒体平台AIGC功能-广点通
媒体平台AIGC功能
AIGC在广告各场景应用
AIGC在广告各场景应用—文生文
AIGC在广告各场景应用—文生图
视频生成
AIGC在广告各场景应用——AI投手
展望
问答
AIGC发展概览
AIGC,即AI文本生成,是基于大型预训练模型的一项技术。它在经典模型的基础上进行了改进,成为科技领域的热门话题之一。
AIGC通过利用模型中的大量参数和数据,寻找规律并具备一定的方法能力,从而生成所需的文本、图像、视频或其他内容。
从狭义上来说,AIGC主要关注图像文本、音频视频等内容的生成。从广义上来说,它还包括生成策略和代码等内容,可以提高代码编写的效率。
在上文左右两边图中,我们可以看到这些生成内容的例子。
-
左边是一张图像,如果你在抖音或者小红书等平台上浏览,可能经常会遇到一些脸部相似的内容。在这种情况下,你不必怀疑,很可能是AIGC用一种软件生成的。
这样的图片看起来灯光和背景会比较统一。如果你不仔细观察其他细节,真实程度还是很高的,它们可以用于广告投放等用途。
-
右边的这张图,是一张对话。我在向他咨询如何写好一份PPT,且不超过200字。在这种情况下,对话会采用一种拟人化的形式,回复方式更加精准和人性化。
对话伙伴会询问你关于PPT主题、排版和演讲速度等方面的需求,并帮助你设计一个好的流程。
与平常的文字文本或生成模型相比,这种对话给人一种与NPC或通用智能交互的感觉。因此,这一技术在chatGPT出现后成为一个新的里程碑。
对于未来的发展,首先我们需要意识到这项技术的实用性,这样我们才会更好地思考如何在各种实际应用场景中大力使用它。
AIGC发展的重要里程碑事件
从前年年底ChatGPT上线以来,它迅速吸引了大量用户的使用。你们刚才看到的截图展示了其中一种使用方式,它给人一种惊艳的通用智能体验。特别是对于那些熟悉AI产品的程序员或用户来说,他们纷纷开始投入使用。
之后,OpenAI开始发布一些新的模型和能力,比如多模态模型。通过上传图片或音频,这些模型可以帮助我们理解其中的内容。这意味着它们具备了视觉和听觉的能力,为我们打开了一个前所未有的领域。
在前年,国内公司如百度、阿里和腾讯纷纷开放了它们自己的大语言模型,而华为、OPPO和Vivo也在他们的手机端推出了大语言模型能力。小米也曾提及过,各个手机厂商基本上都在致力于大语言模型的发展。
与此同时,看到下面一侧,AIGC的发展速度也引起了相关政策法规的关注。由于可能涉及版权和数据源的问题,政策法规部门也在跟进。
之前有新闻提到,各类新闻媒体如纽约时报开始关注是否有机构使用他们的数据进行训练,因为一些生成的内容与其文章高度相似,这可能会引发侵权问题。
另外一方面,AIGC在未来的市场规模是我们评估行业技术发展的一个重要方面。
首先,我们需要关注整个市场的规模预测。若市场规模预测足够庞大,那么AIGC的未来趋势将是一个非常值得投资或创业的前景。
据中国AI产业群体报告显示,到2030年,AIGC的市场规模有望达到万亿级别。
今年,多家厂商已经在主流应用场景中铺开了部署,并推出了一些收费模式。
-
举例来说,像阿里云和华为云开放了大语言模型能力,并提供收费调用服务。
-
另外,一些公司可能会提供图像生成工具,用户可以在其网站上生成并下载图片,下载过程可能需要付费,尤其是对于超出内容的部分。
-
第三种则是用户订阅软件或一次性购买模型,然后针对其私有数据进行定制开发。
这些付费逻辑点可能会在AIGC未来的发展中扮演重要角色,尤其是在面向To C端或To B端的情况下。
右边的图像,是一个名为"妙鸭相机"的app,最近这段时间很流行。它的基本原理是图像生成模型。你可以输入大约20多张图像,让模型学习你的脸部轮廓和细节,并对其进行微调,最后生成符合你预期的证件照。
在AIGC爆发之前,像这种小程序或APP进行AIGC内容生成并不常见,因此使用时会给人一种神奇的感觉。
这种应用的优点是相对于线下或其他拍照方式,它能够即时生成证件照,并且价格更亲民,成品率也相对较高。
总体而言,我认为目前AIGC在这个领域的发展非常迅速,未来将对产业做出重大贡献。过去,数据应用主要基于已有形态,比如输入文本进行分类。
但现在,随着AI技术的发展,与之交互的方式有了根本性的改变。AI可以与用户互动、进行对话,让你感觉像是在与一个智能NPC聊天,这种变化颠覆了以往的流程。
媒体平台AIGC功能
媒体平台AIGC功能-广点通
首先,我使用的是广点通广告账户。作为广告主,当我点击进入后,可以看到创意中心和AIGC工具箱。如果你也是广告主账户,你可以直接进入功能页查看。这些图片都是我从腾讯广告平台上截取的。
从这些图片中可以看出,很多都是关于文生图内容,包括像素材制作、商品核查、智能编辑、快速视图以及文案助手等功能,大多数功能都是以文生图为主。
在左下角,我们可以看到一个行业选项。当你选择素材创作时,它会提供几个选项,包括选择不同行业,然后会针对不同行业做一些个性微调。
它不会一上来就给你一个通用大模型,因为这样的话,模型训练到的效果可能不够精准,输出的效果也不会很好。如果你有对应的行业,选择针对行业进行微调,那么输出的效果就会更符合预期,成功率也会更高。
对于模型的选择,它提供了三个选项。如果你想生成一些常见的物品,比如电商产品、化妆品或瓶子等,写实通用模型可能已经足够好了。
如果你想生成模特或者电商服装模特,我建议选择混元写实模型,因为经过对比,输出的效果更加写实,看起来更加真实。
而如果有去了解过阿里云、腾讯云、华为云这些,在你使用它们的时候,也会提供上述类似的选项给你。
在广点通中,我认为相对比较出色的地方在于右侧的部分。在这一块,当你需要生成文生成图时,你需要有一些文字描述,然后让模型帮助你生成你想要的图片。
在这种情况下,你可能不清楚如何编写文字以确保模型认可并输出高质量的图片。在这点上,广点通做得相当不错。
比如,当我输入“一瓶消毒水”,它可以扩展成三个内容,这显然是针对模型本身的能力。当我们输入“消毒水”时,它可能会自动生成一些内容,比如透明塑料瓶和一些简单的标签。我们可以点击这些标签进行修改,同时微调扩写的细节,对关键词进行修改,使描述更加清晰。
接下来,我将展示一下广点通在这方面的功能。如果我们想要输出一个模特的图片,那么对于输入的描述应该怎样更合适呢?
首先,我可能会简洁地描述为一个穿着连衣裙的模特,正面拍摄,简约背景,高度详细的光线,类似时尚杂志照片的关键词。
因为实际上,整个输出的内容主要是由关键词组成的,要匹配你预期的图片生成样式。你可以看到,管理审核非常严格,左上角和右下角会生成四张图片,但其中两张会被过滤掉。
在这方面,我认为平台还没有做得很好,它应该能够自动过滤掉一些不符合要求的内容,并重新生成符合要求的内容,而不是需要你重新操作来增加交互的程度。
另外,对于右侧的部分,我添加了一个全身照片,质量精致。你会发现,即使我没有输入一些敏感或相对隐晦的词语,它仍然会对我的审核内容和生成内容进行说明。
媒体对内容质量要求较高,而广点通是一个生成素材的工具。通过输入文字并点击立即生成,它可以生成图片,而不是生成文案。
你可以通过使用关键词逐渐使生成的图片更精致、符合预期要求,这是该工具的特点之一。
此外,它还具备商品抠图和商品合成的功能。
就质量而言,我认为这部分相对简单,因为商品合成后的结果可能需要更好的关联性。如果有技术能力,与AIGC的关联可能会更简单,因为它只是帮助你进行简单的抠图。如果你具备Photoshop技能,你也可以轻松实现。
对于没有技术能力的人来说,可以尝试使用这个功能,但实际上,它的定制化能力相对较弱。
接下来我们来谈谈头条。
与广点通相反,头条的投放内容中,文生文的比例较大。
这与头条当前的场景相关,它在这方面做得相当不错。头条在脚本和直播脚本方面的深度较大,首先开放了文生文,因为这方面的能力开放相对较容易。
我了解到,它其实也可以投放文生图,但需要去开白并使用,并没有提供明面上的创意工具体验。
在头条的广告账户中,进入聚焦创意创作工具,你会发现基本上还是以文生文为主。其他功能基本上是一些简单的剪辑或者Photoshop功能。如果你没有技术能力,也可以在这个平台上进行简单的操作。
在右上角的AI视频部分,如果你输入的内容与热门产品相关,比如我的产品是王者荣耀,处理起来可能会更容易,因为模型中可能已经包含了这方面的信息。建议在输入内容时,可以假设你的产品是一个热门产品,对标一些大的竞品,然后进行输入。
输入完成后,如果想要使用其中的内容,可以将其复制出来,然后用你自己的产品或品牌进行替换,这是一个相对不错的技巧。
在视频脚本制作方面,大多数人在使用这些平台产品时不会直接使用它们提供的框架。我认为最好的用法是将其用作灵感的扩展,因为它生成的内容大多是基于网上热门的结构和内容。
你可以通过它来生成本地化的脚本内容,以便在新的平台上触及更广的广告角度,这是最主要的用途之一。
另外一个用途是单品脚本的生成,它也提供了直播脚本,但你不会直接使用它的话术,因为这些话术比较通用。
关键是要利用它的灵感,而不是直接使用其中的内容,否则你的内容可能会与网上的重复度很高。
在视频初期阶段,脚本内容可能存在问题,但如果你在画面和细节上有所差异,你可能会创作出一些热门视频。你需要在细微之处有一些变化,包括整体画面、音频、脚本内容的差异化。总的来说,这个工具主要是用来浏览灵感库的。
在这方面,我认为媒体平台的AI功能是非常重要的。现在主要有三个平台,分别是头条、广点通和百度。
关于为什么没有提到快手,我进行了一些调研,发现快手并没有直接展现AIGC功能的部分,它更多是混编的功能。所以在定义为AI生成内容方面,快手可能并不适用。
我主要关注的是头条、广点通和百度,其中百度的百家号是最简单的一个平台,里面有很多内容。我对这三个平台有一些了解。特别是百度在文本生成方面做得非常好,在国内处于领先地位。
如果你对文本生成感兴趣,即使没有广告主账户,你也可以通过百度的文心一言去体验它的文本生成环境。
媒体平台AIGC功能
-
首先是平台成熟业务
比如字节或者说头条,它们的巨量直播业务做得非常好,因此可以将AI生成内容作为成熟业务的延伸。由于它们拥有大量的数据,所以实施起来更容易成功,因为数据量很大。
再看广点通,为什么要进行文生成图?我个人理解是因为广点通在图文领域确实做得很出色。所以在整个拥有大量数据的环境下,只要你实施AI生成内容,成功的概率就会更高。
-
其次是内容的可信要求
你看一下广点通,即使只是输入一些普通的词汇,便立刻不给你过审。目前AI生成内容正处于快速发展阶段,它可能会受到一些政策要求的限制,AI生成内容对自身的要求也会比较严格。因此,在未来,这一领域可能会陆续采取一些合规措施。
-
最后,未来的想象空间是非常大的
目前的功能相对来说还比较有限,开放的能力维度也不是很全面。我现在只能介绍文生成图这个方面,但是像文生成视频、图生成视频或者视频生成视频等类似场景还没有完全开发出来,可能有一些是从灰度测试的角度,还有一些是私下提供给部分广告主进行体验。
总的来说,在这个领域,未来的发展还将大力推进,因为广告创作内容是一个非常强大且广泛应用的领域。
AIGC在广告各场景应用
目前来说AIGC在广告各场景应用主要有:文生文;文生图、图生图;视频生成;AI投放助手。
AIGC在广告各场景应用—文生文
像前面一二点,现在一些公司或厂商已经开始大规模推广AIGC的各项功能。如果你在一家广告代理公司或广告部门工作,可能会有厂商向你推广AIGC的各项功能,特别是在垂直领域可能会更有优势。
举例来说,文本生成应用已经非常成熟,因为它符合了广告文案、小红书文和广告文案等领域的需求。相对来说,使用文本生成应用会更容易且更成熟。在广告营销的文本生成场景中,可能会面临选择哪种文本生成模型的困惑,因为现在有太多的模型可供选择。
然而,如果你不知道该选哪个,那么选择chatGPT系列肯定是一个明智的选择,因为在综合性能上,它无疑是最优秀的。
如果你无法使用GPT-4或者其他版本,我建议你可以尝试国内的模型,因为国内在文本生成领域已经开始赶上像chatGPT这样的领先模型,比如文心一言、阿里的通讯新闻、腾讯的会员以及搜狗或讯飞等。
基本上,当你使用完这些模型之后,你会发现它们就像智能NPC一样与你交互,并且生成的内容质量也不错。
总体来说,就中文语言理解和生成能力而言,国内的大型模型已经迎头赶上国外的同类模型。这一维度可能是国内模型的相对优势,因为它们专注于中文领域。
在选择模型时,首先你需要选择一个模型。然后,你可以使用该模型生成内容。在使用过程中,你可能会遇到一些困惑,例如在进入文心一言、chatGPT页面后,你可能不清楚如何输入内容以获得更好的文本生成结果。
我通过一个流程图逐步介绍给你,并为你提供反馈。如果你的输入内容不太合适,你可以再输入一些内容,模型会逐渐变得更准确,并且生成的内容将更符合你的预期。
在我最左边的话是一个设计师一个角色,首先我们需要使用大型语言模型或文心一言来生成符合蛋仔派对宣传信息流的文案,长度不超过30个字。
我们输入一个请求,模型可能会返回这样一句话:"蛋仔派对,脆香甜"。如果你对蛋仔派对有所了解,你可能会笑,因为蛋仔派对是一个游戏,这样的广告传播肯定是有问题的,因此这个文案是不可行的。
在使用大型语言模型时,首先需要明确指出你的需求。大型语言模型与角色扮演有很大的不同,你让他去写一个PPT演讲稿,你就对他说你是一个PPT演讲专家,如果你要让他写一个文案,你就跟他讲说你是一个文案写作专家。
它需要清晰的指导,因为它的数据量和维度远超角色扮演,需要将你的需求映射到相应的数据集或数据维度,然后提供相关背景知识,以生成符合预期的内容。
从广告文案的角度来看,"加入我们的蛋仔派对,一起探索这充满乐趣的世界吧!"这句话可能显得有些冗长。通常广告标题大约在15字以内,有时可以延伸到30字以内。因此,我们需要进行关键词提取,以确保文案简洁明了。
在我圈选的中间有一块叫做“Prompt”的设计增强。关于"Prompt"的设计增强,它指的是输入内容的方式,是一个专有术语。关键词提取需要精准表达想要传达的信息,使文案更口语化、年轻化,符合信息流用户的语言习惯。
这样的设计能够被大型语言模型理解,并输出符合预期的内容。
第二个就是在进行广告文案编辑时,需要专注于分享游戏体验,而不是直接引导下载。同时,避免使用拉踩或其他极限表达形式,尽量避免类似广告法的用词。
我们希望避免模型输出一些过于极端的内容。但你看,你输出完之后。他就输出“蛋仔派对简直是我的最爱”,并不符合要求。
大型语言模型的输出具有一定的概率性,因此并不是输入什么就一定会得到相应的反馈。我们的目标是通过良好的写作方式,提高模型输出符合预期内容的概率,虽然无法完全确保百分之百的准确性,但通过逐步改进,我们可以提高模型输出准确内容的概率,通过后面的一个思路慢慢去生成。
第三个叫集成学习,另外也叫对抗学习。例如我在文心一言输入相关指令,文案出来了。我新增一个对话,问另外一个文心一言,评价刚刚那个文心一言生成的文案是否合适。通过这种方式,他对抗,我评价,然后把评价返回给我,以此让模型进行学习,包括了解我在之前提到的需要补充的内容。
在这个过程中,模型可能会提供一些评价,并给出优化建议。优化建议中可能会涉及到他提到的最喜爱的游戏,指出了之前没有明确说明的问题,然后将"我的最爱"改为"我最喜欢的游戏"可能会更好一些。
有一个术语叫做大语言模型中的CoT,它是思维链和数据链的提示方式,是一个相对专有的定义。
类似于代理模型的研究,有人发表论文指出,对于特定问题,可以通过教导模型进行简单计算,例如教它1加1等于2,2加2等于4。这种教学方法可以通过问答和示例来实现,在输入过程中,我们可以写下这个过程,并发现准确率会明显提高,同时也符合稳定性的要求。
类似的,对于文案生成,如果出现不符合广告法的内容,比如使用"最"、"第一"等词语,我们可以将这些文案替换为合适的词语。
请你一步一步思考,这句话也要教,因为你少加一句,或者说多加一句,反馈的结果是不太一样的。
它最后生成“你听过蛋仔派对吗?它简直是我很喜欢的游戏!赶紧来邀请你的小伙伴一起参与这场战斗,感受蛋搭子的派对吧!”从一开始的“蛋仔派对,脆香甜!”会直观感受到广告文案的整个生成过程。
AIGC在广告各场景应用—文生图
相比文生图,我觉得文生文更容易理解。在广告平台上,我们经常会看到文案助手等工具,它们可以生成一些文案,这可能就是文生文的初步雏形。
文生文在特定场景下可能更成熟,但是文生图的颠覆性更大。
以前你可能需要使用Photoshop来创建图像,但现在它可以直接生成一张图。
这张图可能与你预期的成品相差不大,现在可以直接使用,甚至简单的插画或游戏插图,稍加修饰后就可以使用,这是之前完全没有想象到的。
整个设计软件,从工具类应用到生产力应用的转变,我觉得在AIGC所做的文生图和图片领域,带来了颠覆性的变革。
页面上展示的内容,你可能看不出来是由AI生成的,可能会以为是由专业设计师制作的成品图,这带来了一种全新的体验。
现在我来说明一下,传统工作流以及AI生产的工作流有何不同。
传统工作流
传统工作流通常包括几个步骤。首先是方案设定,通常基于营销策略和投放结果,确定后续素材内容生成的主题方向。
接下来是草案设计,你会提供一个相对粗糙的稿子,因为很少一稿就能通过审核。你会将这份初稿交给客户或者投放团队的同事,等待确认后才会进行大规模的创意设计。
设计完成后,部分成品交付或成品交付后可能需要进行创意微调和修改,最终交付成品。传统工作流可以简单理解为流水线式的流程。
AI生成工作流
由于AI的快速发展,它在主题生成方面的能力已经相当出色。
主题生成是指从一些关键词中提取主题,然后使用AI生成相关内容。在这个过程中,你可能会得到许多生成的内容,然后将其呈现给业务方。由于生成的量可能很大,业务方可能会选择其中一个方向进行批准。
一旦批准后,你可以通过AI直接对细节进行进一步的控制,以便快速得到最终的数字成品,这是一种AI生成工作流的方式。
第二种方式是输出一些半成品,例如背景图,然后你可以选择找真实模特进行拍摄,再与AI进行平衡。这种AI创意可以提升你的效率。接着是注册微调和加工产品。你会逐渐发现它会提高你的制作效率,并扩大你的创作思维的覆盖范围。
另外,文生图最主要最核心的两个应用,一个是StableDiffusion,一个是Midjourney。
对于那些拥有技术能力的内部广告增长平台或创意管理平台,大部分都会致力于实现高度定制化。特别是在电商领域,这一点尤为突出。它们可以进行精细的肢体调节和控制,相对于目前其他厂家提供的控制方式,定制化程度更高。
而像Midjourney这样的平台,它输出的图像通常具有高清晰度和高度精美的特点。大多数情况下,Midjourney的输出内容也会符合你的要求。
我注意到很多设计师同行都会在这个平台上生成一些草图,并进行微调。因为使用这个平台,你只需要一定的途径即可,而不需要自己搭建服务器等复杂操作。因此,大多数设计师同行更倾向于使用Midjourney。
以Midjourney为例
首先,你需要提取营销策略和关键词的信息以确定整体设计风格。对于提取关键词,你可以使用Midjourney的参考图作为输入,或者根据自己已有的关键词或情绪板进行输入。
如果你需要进行类似延伸或竞品的设计,Midjourney可以输出相关的关键词。完成关键词输出后,你可以使用以下命令来了解Midjourney模型的特点。
建议你先了解一下这些命令,以便更好地使用关键词生成功能。如果你对Midjourney模型不太熟悉,我建议你上网搜索相关资料,这将有助于你快速入门。
另外,细节修改和垫图也是Midjourney的特点。对于细节修改,我建议你使用垫图。垫图类似于你之前已经有的成品图,但你希望进行一些形状或色调上的调整。
好比化妆品形状本来是竖的,但你希望它是斜一点的。如果直接使用关键词,它可能无法满足你的要求,因为关键词可能存在一些偏差。但是,使用垫图后,你可以将图像和文字结合,整体内容就能更好地达到你的预期。
在进行细节修改时,还有一个叫做图像权重系数的参数。一般来说,推荐的经验参数是1到2。你可以直接使用2,因为这是一个经验参数。使用这个参数后,生成的图像可能会更接近你的垫图内容,因为你本来就希望将其内容进行组合。
在使用垫图时,有几个要点需要注意。
-
首先,垫图应该是一张没有文字的图片。如果垫图带有文字,生成的图像可能会包含乱七八糟的文字,并且不符合你的字体要求,所以最好避免这种情况。
-
其次,垫图中的细节不应太多,因为太多的细节会使模型难以理解你想要突出的主体是什么。
-
第三,垫图的风格应与需求相符。你不能使用一张与目标完全不同风格的照片作为垫图,例如用一张纯黑的照片去垫一张白色背景的图,这样的要求是不一致的。
总的来说,通过这样的输入,在Midjourney的流程中按下辅助键,你会发现生成的图像与参考图非常相似。因为垫图实际上是参考图去除了一些文字和背景材料后进行的绘制,目的是与参考图相似。
视频生成
目前来看,视频生成任务本身就具有相当大的挑战性。我所展示的样品示例已经相当不错了。但实际体验时,与期望的效果还有相当大的差距。
因此,整个视频生成流程目前还未达到非常出色的水平。每一帧的过渡和细节表达都需要更精细的处理,特别是在需要满足广告视频等15秒到30秒的短时任务要求时,我们对细节的要求会更高。
当然,我相信未来会有更多突破和创新,视频生成技术会不断发展。我对这方面充满期待,因为整个流程目前还在不断发展之中,而像类动画使用会比较多。
对于我们来说,视频生成在信息流和广告主办方面都是非常重要的环节,因为视频媒体在当前的信息流中已经占据了很大的比重。
那么,我们应该如何解决这个问题?我们应该如何利用大型语言模型来提升视频生成的产能和内容效果呢?
我要向大家介绍一个我们自己内部的实用技术,即AI混编。
在AI混编中,我们使用视频镜头的素材。通常情况下,混编是通过将多个视频镜头组合成一个视频。
但是,通过AI技术或者设计师的帮助,我们可以将这些素材或视频片段分解成原始材料,然后利用大型语言模型和机器学习模型重新组合,生成一个具有故事情节或相似内容的视频。
市面上的一些混编产品大多数仍然需要人工处理,尽管它们有一些推荐逻辑,但手工处理仍然占据主导地位。然而,我提出的方案可能只需要很少的手工处理,主要是维护一些元素、片段。
整体而言,后续的生成过程可能会比完全手工操作效果更好。
在混编过程中,如果使用过多相似素材,可能会导致重复度过高。通过类似脚本生成的方式,利用生成模型生成虚拟脚本,可以满足一些特定要求。
这种方法可以利用历史脚本数据以及大型语言模型的输入,生成略有不同或更好的脚本。设计师也可以提供脚本结构,因为AI需要使用大型语言模型来完成这些任务。
我们可以通过素材片段的组合推荐来构建脚本结构。这里有一个关键点:是镜头推荐模型,它是一个图像识别模型,用于评估镜头的质量和相似度。
这个模型会对镜头进行数据评估,判断镜头的受欢迎程度以及与其他镜头的相似度。然后,我们让生成模型将这些有潜力的镜头串联起来。
接着,通过向量数据库,也就是大型语言模型中称为知识库或搜索引擎库,我们存储了大量视频片段,可以在这个数据库中检索出我们需要的整个视频片段。
完成这些步骤后,我们可以得到一个预设的分类,包括黄金三秒和故事内容还有落版。
AIGC在广告各场景应用——AI投手
利用Agent协作进行广告投放
AI投手的话,我们使用的是Agent。很多人可能接触到文生图,但不知道Agent是什么东西。
Agent指的是一种能够感知环境、理解环境并做出决策和采取行动的人工智能系统,它是一个不断学习和进化的AI系统,具备强化学习能力,可以做出智能决策。
比如下面的游戏场景,左边是一个小镇,叫做斯坦福小镇,这是一个游戏中的地方,会有很多NPC,而这些NPC实际上都是Agent,他们有自己的初始设定,会自己进行对话,类似于自然对话,没有人为干预。
我们进行了一个实验,两周后,他们可以自己组织一个派对,甚至有些NPC会主动去找别人结婚。我们并没有编写NPC的脚本或者决策流程,完全是通过大模型的技术实现的。
所以,这里有一个AI投手的概念,因为像智能投放这样的东西,比如广告投放,大家希望有一个投手来帮助实现整个智能投放环节,实现自动投放,解放人力,并实现一些策略执行的环节。
Agent 强化学习
Agent 本身是强化学习的过程,加上大语言模型的技术,整合起来就是AI的新技术。训练方面,因为智能投放需要准备和思考的环节很多,所以并不是说使用一个Agent就可以完全实现,这是不现实的。
在运营方面有两个层级,第一个是利用模型预测成绩,通过Marketing API的接口拉取投放数据,根据业务规则判断正负样本。投手们在做一些内容和操作时,并不清楚自己的操作是否正常,所以可能会出现问题。
通过数据清洗和针对我们当前阶段目标的一些规则,比如成本优先、过量优先或ROI优先,进行正负样本的清洗。完成这个模型后,就会得到一些候选广告,这些广告会有一些得分。
这一部分是一个找约束的过程,我们预测得分时,并没有强制要求它是怎样的情况,我们希望它按照成本优先或获量优先的方式进行预测,这是从机器学习预测的角度出发的。
可能我们会有一些场景,使用这个模型进行广告推荐,这已经是一个非常成熟的环节了。但现在我们不再由人来操作广告推荐,而是由AI来操作。对于这些AI,我们需要给它们一些约束,我称之为硬性约束,比如总预算、人群定向和创意等。
因为你必须给它们一个不可逾越的目标,否则如果它们帮你跑太多量,或者增加了成本,那就会很麻烦。在这里,约束是必要的,我们可能会有不同的配置,这些配置要在投放中进行调整。
Agent的话,有一个预算敏感型和成本敏感型,还有一个是记忆模块。广告本身是一个周期性的东西,你可能上半年是这样子的,下半年可能就不是这样子了,所以你会选择设定时长。
第三个的话,要理解整个创建计划的流程,包括预算、规格、计划数量。
在这个具体的流程中,我们在预测范围内根据我们的要求筛选符合条件的元素。接着,我们对这些元素进行软约束并进行评分。
完成评分后,我们进行筛选,得到符合要求的一些计划。然后进行投放,根据效果数据再次执行计划阶段,然后不断反复,最终达到我们的投放要求。
AI投放的核心在于强化学习和决策学习。目前机器无法保证100%的成功。整个流程是数据化的,因为你可以通过这个流程去改进整个AI投放的细节。如果能够复制可用的AI投放策略,就可以省去很多成本。
从某种程度上来说,它可能会覆盖三分之二到四分之一的投放工作,只需要在决策层做一些流程上的调整。我认为在广告领域,这是我们未来可能会探索的方向。
展望
目前来看,作为运营,我认为提升广告内容的创作和决策效率是非常重要的。
我们应该充分利用创作和决策的优势来提高效率。我注意到有些同事或设计人员了解一些技术细节,但他们直接使用市面上的通用工具。
我个人建议不要这样操作,因为通用工具往往不能满足产品的具体要求,工具的落地效果与产品实际需求之间存在较大差异。因此,我们需要在通用工具的基础上进行优化和定制,实现更精细化的创作,以满足深层次的需求。
考虑到AI在规模化方面的优势,我建议逐步利用对广告整体策略的控制流程。最初,可以尝试优化其中的某个方面,而不是一下子尝试优化多个方面。否则,你可能不清楚哪个部分需要优化,这会导致大量资源的浪费,因为素材上的消耗通常是相当大的。
因此,建议采取渐进式的方式,以便更具针对性地投放,并且对AI的效果会更加显著。最终,无论是文本、图片还是视频,通过你的流程或产品特质进行优化是非常重要的。
问答
Q1:游戏广告素材视频有没有一个最佳一些最佳时间路径?
从视频的角度来看,我们讨论的主要内容是关于游戏广告素材的制作。例如,对于夜间游戏,可以在视频剪辑过程中添加各种过渡特效。
此外,对于游戏中的元素,如标语或贴图,从媒体的角度来看,它们已经包含了一些内容和画面的变化。由于游戏内容相对有限,如果要大规模生产,可能会遇到一些流程上的问题和重复度较高的挑战。
因此,建议在贴图上加入动画元素,以丰富整个故事线,从而减少重复内容的数量。你可以通过游戏内容的丰富度来存储视频元素,将整个流程串联起来。
无论如何,只要给每个环节打上标签,并通过AI技术让系统理解,就可以实现这一点。虽然AI投手技术可能比较难以理解如何进行投放,但是通过创新理解整个游戏视频内容的环节是相对简单的。
算法工程师可以尝试实现这一流程,并获得良好的结果。我认为最重要的一点是,通过这种方式,您可以大大缓解重复内容的问题。
Q2:AIGC生成广告可以全自动的说一定要人工参与?
根据目前的情况来看,如果要参与其中,可能只占到了30%左右,但仍然必须要有一定的参与度。有两个关键点需要考虑。
首先,如果您希望生成的内容质量较高,必须进行审核。如果不进行审核,可能会出现一些问题,比如生成的模特可能会有三只手,或者女生的手指可能有四只或只有一只,这显然不符合您的要求。
因此,您必须审核这些内容才能进行投放,因为这会对线上投放效果产生很大的影响,尤其是在大规模投放的情况下,风险也会增加。
另外一个关键点是,在前期阶段仍然需要一些主题或关键词的设定。您不能完全没有任何限制,然后期望系统能够按照正常的流程生成内容。
如果没有一些明确的关键词,系统可能会陷入一个死循环,生成的内容会越来越同质化,最终无法达到您的预期。
因此,在参与这个过程时,需要审核生成的内容,并设定一些主题或关键词,以确保所生成的内容质量较高且多样化,从而达到预期的效果。
Q3:AI生成的内容都是根据历史数据源,广告的创新程度不高的话,会不会跟媒体算法推荐冲突?
在整个流程中,我希望大家能够充分利用AI技术。具体来说,通过垂直领域的数据来进行操作,而不是简单地使用一个在线的预训练模型。
为什么这么说呢?因为在线预训练模型往往是基于公开的数据集,或者是别人已经训练好的模型。
如果你再用这些模型进行训练,那么你最初发布的内容很可能与其他人的内容相似。对于图片处理,特别是视频生成,无论是UGC(用户生成内容)还是用户上传的视频,已经有很多相关的应用了。
所以,在这个领域中,你应该使用自己领域的数据集来进行模型训练,而不是使用公共的数据集。(国内可以搜索的大语言模型排量数据资料,大多可以在SuperClue社群找到)。
你的公司肯定有一些小型产品或者已经积累了一定数量的数据,如果你没有足够的数据积累,我建议你可以参考竞争对手的信息或者使用已经成熟的竞品数据,这样可以提高你的效率。你不需要全部重新做一遍,但可以通过它们来提高你的初期效率,这是可行的。
所以,这个东西本身也不能完全照搬。因此,创新程度取决于你对数据源的掌控能力。如果你拥有自己的数据源,那么就不会违背媒体对创新程度的要求。
你可以开始时有一个由十个设计师组成的团队,后来可能剩下五个人,但是这五个人的工作效率会更高。它不能完全取代设计师同行,因为它只是一个工具,而不是完全智能化的东西。
关于图像处理,我认为人工的工作不仅仅是处理图像,更重要的是广告的人文因素。这也是一个要考虑的因素。就像我刚才提到的,你不能将带有背景和文字的图片直接放入电子图中,因为电子图生成的字体和文字可能会变得混乱,而且字体可能不符合你的要求,因为某些字体是受版权保护的。
在这方面,你肯定需要自己进行操作,这可以节省前期流程中可能产生的许多工作,这是提高效率的一部分。
Q4:AIGC的广告价值在于数量还是质量?
我认为这个环节目前还没有一个确定的标准答案。首先,这只是我个人的观点,并没有一个明确的答案。在项目刚开始时,或者说团队还没有达到较高水平时,我们需要达成共识。
如果能够达成共识,后续的问题就不会成为障碍。你提到的AIGC,你的最终目标是提高效率。如果这个方法能够奏效,无论是在项目初期人员较少的情况下,还是在人力资源充足的情况下,你开始时采用这种方法可能会有一定的优势。
可能在质量上无法与其他方法相媲美,但是因为你能够更快地推出更多的内容,所以就有可能取得成功。因此,你首先要确保质量至少达到一个基准,然后才能提高效率。
第二个方面,当你的项目已经相对成熟,团队或产品已经比较成熟时,AIGC可以帮助你减少常规图像或视频工作的工作量。它可以解决这个问题,让你有更多的时间去探索和创作精品内容。在这方面,它可以体现整体质量的标准。
因此,AIGC本质上是一个工具和流程,它只是作为一个基础,而设计团队的思想、创意和设计流程才是最重要的。文章来源:https://www.toymoban.com/news/detail-797390.html
质量和数量也是在设计团队中体现出来的。AIGC并不能完全串联整个流程,但可以帮助你更快地推进整个投放过程。文章来源地址https://www.toymoban.com/news/detail-797390.html
到了这里,关于AIGC内容分享(三十四):AIGC+信息流广告的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!