学习之旅:揭秘AI绘画与视频生成的奥妙(2)

这篇具有很好参考价值的文章主要介绍了学习之旅:揭秘AI绘画与视频生成的奥妙(2)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

前言

        在这篇文章中,我们将深入探讨如何使用Ebsynth Utility插件为视频带来全新的视觉效果。通过重绘视频,我们可以实现对视频风格的调整,为其增添独特的艺术氛围。我们将分享实际操作步骤以及过程中可能遇到的问题,帮助大家更好地掌握这一技巧。

        请注意,本文中的部分内容来自网络搜集和个人实践,如有任何错误,请随时向我们提出批评和指正。本文仅供学习和交流使用,不涉及任何商业目的。如果因本文内容引发版权或侵权问题,请通过私信告知我们,我们将立即予以删除。

目录

前言

Ebsynth Utility插件简介

准备工作与环境设置

1.下载Ebsynth

Ebsynth详细介绍

2.下载FFmpeg

FFmpeg详细介绍

3.安装transparent-background

4.安装WebUI扩展Ebsynth Utility插件

尝试开始

步骤 1  从原始视频中提取帧,并给每一帧生成一个蒙版图像。

步骤 2  选择关键帧提交到 Ebsynth。

步骤 3  将关键帧进行图生图。

步骤 3.5

步骤 4

步骤 5  重命名关键帧。生成 .ebs 文件。(Ebsynth 工程文件)

步骤 6   运行 Ebsynth。(自行操作)

步骤 7 在交叉融合运算时串联每一帧。

步骤 8

总结

参考


Ebsynth Utility插件简介

Ebsynth Utility插件是一款强大的视频处理工具,它允许用户将一幅静态图像中的艺术风格或纹理映射到一段视频上。通过使用先进的计算机视觉和图像处理技术,Ebsynth能够分析图像内容并智能地将所选风格应用到视频帧上,从而实现独特的视觉效果。

插件的主要特点包括:

  1. 高度自动化:Ebsynth能够自动分析图像和视频,无需手动配置复杂数值参数。
  2. 实时预览:插件提供实时预览功能,使用户能够快速查看风格转换效果。
  3. 支持多种格式:Ebsynth支持各种主流的图像和视频格式,方便用户进行导入和导出。
  4. 完全可定制:用户可以根据需求调整各项参数,实现个性化的视频处理效果。

Ebsynth Utility插件广泛应用于动画制作、短片创作、广告设计等领域,有助于为视频增添独特的艺术风格。无论是将手绘插画风格应用于实景视频,还是为视频带来油画般的质感,都能借助Ebsynth轻松实现。

准备工作与环境设置

1.下载Ebsynth

EbSynth - Transform Video by Painting Over a Single Frame

ffmpeg 蒙版,stable diffusion,学习,AI作画

 下载后解压记住路径即可,后续使用这个软件补帧

Ebsynth详细介绍

Ebsynth是一款颠覆性的图像和视频处理软件,它采用先进的算法将一幅静态图像中的艺术风格和纹理转换到一段视频上。借助Ebsynth,用户可以轻松地为视频带来全新的视觉效果,实现独特的艺术风格。以下是Ebsynth的一些主要特性和功能:

  1. 基于样本的图像合成技术:Ebsynth的核心技术是基于样本的图像合成,它能够分析输入的图像样本和视频序列,智能地应用样本中的风格到视频的每一帧,从而实现高质量的风格迁移。

  2. 自动关键帧选择与优化:Ebsynth自动分析视频序列,确定关键帧并将所选风格应用于关键帧。之后,软件会智能地在关键帧之间进行插值,确保视频中的风格迁移平滑自然。

  3. 灵活的控制参数:Ebsynth提供了多种参数,供用户根据需求进行调整。例如,可以调整风格强度、纹理大小和保持原有颜色等,实现个性化的视频处理效果。

  4. 高效的性能与实时预览:Ebsynth具备高效的性能,能够在较短时间内处理大量帧。此外,软件还提供实时预览功能,允许用户随时查看风格迁移的效果,方便进行参数调整。

  5. 多平台支持:Ebsynth支持Windows和macOS操作系统,同时提供了命令行和图形用户界面两种操作方式,满足不同用户的需求。

  6. 广泛的应用领域:Ebsynth在动画制作、短片创作、广告设计等领域具有广泛的应用前景。无论是实现手绘插画风格的实景视频,还是为视频赋予油画般的质感,Ebsynth都能轻松实现。

Ebsynth的强大功能和易用性使其成为视频创作者和艺术家们的理想选择,它为视频处理和风格迁移提供了全新的可能性。

2.下载FFmpeg


FFmpeg

点击上方连接进入官网下载后解压

ffmpeg 蒙版,stable diffusion,学习,AI作画

 配置解压后文件夹中bin文件夹路径到系统变量中的path

ffmpeg 蒙版,stable diffusion,学习,AI作画

点击新建粘贴路径后确定

ffmpeg 蒙版,stable diffusion,学习,AI作画

FFmpeg详细介绍

FFmpeg是一个开源、跨平台的多媒体处理工具库,包括了处理音频、视频和图像等多种格式的解码器、编码器、滤镜和流复用器。它提供了命令行工具和开发库,可以用于音频和视频的转换、编辑、处理和播放。以下是FFmpeg的一些主要特性和功能:

1. **支持众多格式**:FFmpeg支持诸多音频、视频和容器格式,包括但不限于MP3、AAC、FLAC、H.264、H.265、VP8、VP9、AVI、MP4、MKV等。这使得FFmpeg可以在几乎所有的多媒体处理场景中使用。

2. **编解码器与滤镜**:FFmpeg提供了大量的编解码器,允许用户对音频和视频进行编码和解码。同时,FFmpeg还提供了丰富的滤镜,如缩放、旋转、裁剪、字幕添加等,方便用户对多媒体文件进行编辑和处理。

3. **高性能与优化**:FFmpeg针对各种硬件平台进行了优化,以实现高性能的音频和视频处理。例如,FFmpeg支持硬件加速,可以利用GPU进行编解码,从而大大缩短处理时间。

4. **跨平台兼容性**:FFmpeg可以在Windows、macOS、Linux等多种操作系统上运行,为用户提供了广泛的平台选择。

5. **命令行工具与开发库**:FFmpeg提供了命令行工具`ffmpeg`,允许用户通过简单的命令完成多媒体处理任务,同时还提供了开发库,方便开发者将FFmpeg功能集成到自己的应用程序中。

6. **活跃的社区支持**:作为一个开源项目,FFmpeg拥有庞大的社区支持,用户可以在社区中寻求帮助、分享经验和贡献代码。

FFmpeg凭借其强大功能、高性能和跨平台兼容性,成为了音视频处理领域的事实标准。无论是个人用户还是专业开发者,都可以借助FFmpeg轻松完成多媒体处理任务。

3.安装transparent-background

打开命令提示符或终端窗口。
将当前目录更改为你的整合包python路径,如"F:\stable diffusion-v4.2\python"。你可以使用cd命令来更改目录,例如:cd F:\stable diffusion-v4.2\python。
在命令提示符或终端窗口中输入以下命令并按下回车键:

pip install transparent-background。

等待安装完成。安装过程中会显示一些信息,包括正在下载和安装的文件。
安装完成后,你就可以在Python代码中使用"transparent-background"包了。
请注意,你需要确保你的计算机上已经安装了Python,并且Python的可执行文件路径为"F:\stable diffusion-v4.2\python\python.exe"。如果你的Python安装路径不同,你需要相应地修改命令中的路径。

4.安装WebUI扩展Ebsynth Utility插件

WebUI扩展:

GitHub - s9roll7/ebsynth_utility: AUTOMATIC1111 UI extension for creating videos using img2img and ebsynth.

ffmpeg 蒙版,stable diffusion,学习,AI作画

尝试开始

        Stable Diffusion WEBUI来源:秋葉aaaki的个人空间-秋葉aaaki个人主页-哔哩哔哩视频

        动画转绘教程来源:Nenly同学的个人空间-Nenly同学个人主页-哔哩哔哩视频

        演示图片:学习之旅:揭秘AI绘画与视频生成的奥妙(1)_friklogff的博客-CSDN博客

步骤 1  从原始视频中提取帧,并给每一帧生成一个蒙版图像。


ffmpeg 蒙版,stable diffusion,学习,AI作画这里可以不变,默认生成蒙版 

ffmpeg 蒙版,stable diffusion,学习,AI作画点击生成后output中出现两个文件夹

ffmpeg 蒙版,stable diffusion,学习,AI作画

video frame存储提取帧
video mask存储蒙版图像

步骤 2  选择关键帧提交到 Ebsynth。

video_key存储提取帧关键帧
ffmpeg 蒙版,stable diffusion,学习,AI作画

步骤 3  将关键帧进行图生图。

在我们上传视频后,就可以切换步骤3点击生成,这一步只是检测我们的视频路径是否正确能打开

ffmpeg 蒙版,stable diffusion,学习,AI作画

根据视频尺寸然后返回类似如下信息用于图生图

5. I recommend to fill in the "Width" field with [512]//推荐宽度512
6. I recommend to fill in the "Height" field with [960]//推荐高度960
7. I recommend to fill in the "Denoising strength" field with lower than 0.35

//推荐重绘幅度0.35
(When using controlnet together, you can put in large values (even 1.0 is possible).)

(使用controlnet的话,推荐重绘幅度可以更高)

        从video_key中选一张尽量不模糊的任意一张图片拖入图生图界面,这一步按照你想要的风格与特点随意发挥,就和正常的图

        在之前的从零开始-与大语言模型对话学技术-gradio篇(3)_friklogff的博客-CSDN博客中,我们探讨过gradio的UI设计,这种标签页的UI设计方案在UI启动时每个标签页是同时启动的,切换标签页并不会丢失之前的输入输出路径配置。

ffmpeg 蒙版,stable diffusion,学习,AI作画

        这里我简单的先固定种子更换了lora模型并重绘。

ffmpeg 蒙版,stable diffusion,学习,AI作画

        由于显存不足,我使用controlnet会经常爆显存,使用Tiled VAE 插件会可以解决但会耗费大量时间,这里我们可以基于他的推荐进行调整,尽量保证新图与原图人物动作一致,

        然后我们将脚本切换至ebsynth utility,粘贴第一步的工程目录,再点击生成即可批量对每张关键帧照片进行图生图操作。

ffmpeg 蒙版,stable diffusion,学习,AI作画

步骤 3.5

(此步骤可选。对图生图的结果进行颜色校正,可能会减少视频闪烁。或者,你也可以简单地在生成结果中调色。)

这里我的显卡和知识储备不足,实际也可以跳过
 

步骤 4

放大图片到原始视频的尺寸。
这里我的显卡和知识储备不足,实际也可以跳过

步骤 5  重命名关键帧。生成 .ebs 文件。(Ebsynth 工程文件)


当步骤3你批量生成好AI重绘的关键帧后,切换至步骤5点击生成ffmpeg 蒙版,stable diffusion,学习,AI作画这里会将重绘的关键帧按顺序重命名,打包成若干个 .ebs 文件

ffmpeg 蒙版,stable diffusion,学习,AI作画

步骤 6   运行 Ebsynth。(自行操作)


打开工程目录下生成的 .ebs 文件,按[Run All]按钮。
如果out-*目录已经存在于工程目录中,请在执行前手动删除它。
如果生成了多个 .ebs 文件,则需要全部运行。

 此时右键选择打开方式,找到我们第一步下载的Ebsynth,逐个打开ffmpeg 蒙版,stable diffusion,学习,AI作画ffmpeg 蒙版,stable diffusion,学习,AI作画ffmpeg 蒙版,stable diffusion,学习,AI作画

ffmpeg 蒙版,stable diffusion,学习,AI作画

点击Run All,实现每一部分的关键帧自动补帧 

步骤 7 在交叉融合运算时串联每一帧。

将原始视频中的音频整合到生成的视频中。

当你完成以上每一步,直接切换至步骤7点击生成即可

with_snd是有声音版本,另一个是没有声音的版本

ffmpeg 蒙版,stable diffusion,学习,AI作画

步骤 8

这是一个额外的步骤。
你可以任何你喜欢的图像或者视频放在背景中。
你可以在这里设置 -> [Ebsynth Utility]->[插件配置]->[步骤 8]->[背景源]
如果你已经在反相蒙版模式下创建了一个背景视频([Ebsynth Utility]->[插件配置]->[其他]->[蒙版模式]),
可以将其设置为“你的工程目录/inv/crossfade_tmp”。

这里我的显卡和知识储备不足,实际也可以跳过

总结

        以上内容大致记录了我的一次简单AI转绘视频,本人第一次尝试,有许多不足,我们希望本文能为您提供实用的指导和有价值的见解。如果您对本文感兴趣或有疑问,请给我点个关注,留下评论并分享。敬请期待我们后续的文章,将为您带来更多我的实践实例。

参考

 Stable Diffusion WEBUI来源:秋葉aaaki的个人空间-秋葉aaaki个人主页-哔哩哔哩视频

 动画转绘教程来源:Nenly同学的个人空间-Nenly同学个人主页-哔哩哔哩视频

 演示图片:学习之旅:揭秘AI绘画与视频生成的奥妙(1)_friklogff的博客-CSDN博客文章来源地址https://www.toymoban.com/news/detail-631652.html

到了这里,关于学习之旅:揭秘AI绘画与视频生成的奥妙(2)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • AI绘画与虚拟人生成实践(三):让虚拟形象动起来!照片生成说话的视频

    书接上回,本篇的目的是结合上篇生成虚拟的女生形象,以及上一篇生成的关于介绍AI绘画领域的脚本,让生成的虚拟形象来念这段文案。先进入正题说明怎么来生成想要的动态视频。 Yanderify 教程 来实际手把手操作一下这个项目 Yanderify:https://github.com/dunnousername/yanderifier 在

    2024年02月09日
    浏览(30)
  • 揭秘!我用AI写了一部精彩小说;搭建AI视频创作工作流;一键生成摘要工具清单;大模型创业生死5问 | ShowMeAI日报

    👀 日报周刊合集 | 🎡 生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! 作者团队梳理了自2018年以来大语言模型的发展历程,并可视化成了这棵树的生长过程。对于模型的学习和选择,都非常有参考意义。 GIF高清动图 和 JPG高清图有点大,放在咱们的知识星球里了,

    2024年02月10日
    浏览(44)
  • 标题:探索AI绘画:使用深度学习生成艺术

    正文: 随着计算机技术的发展,人工智能在各个领域取得了显著的成果。 通过训练深度学习模型,AI可以学习大量的艺术作品,从而生成具有独特风格和创意的新作品。 本文将介绍如何使用 Python 和 TensorFlow 实现一个简单的AI绘画程序。   二、技术介绍 深度学习 :深度学习

    2024年04月11日
    浏览(27)
  • 三秒绘画!我的AI绘画之旅——Adobe体验

    首发于微信公众号:AI执剑人(微信号: AISwordholder ),欢迎大家订阅关注! 你敢相信下面这幅图只用了三秒就画出来了吗? 画画如此简单,这都是源于AIGC的快速发展,所谓AIGC,就是使用人工智能来生成内容,是现在人工智能中最为火热的领域之一!你只需要告诉人工智能

    2024年02月09日
    浏览(35)
  • 寻找最佳AI绘画软件:七款软件比较大揭秘!

    在数字时代的今天,AI技术已经广泛渗透到各个领域,艺术创作也不例外。AI绘画软件的出现使艺术家们能够更快速、高效地进行创作。然而,在市场上选择一款合适的AI绘画软件却让人眼花缭乱。那么,究竟哪个AI绘画软件更适合您呢?要明确的是,不同的AI绘画软件具有各自

    2024年02月15日
    浏览(27)
  • QQGC?揭秘QQ的AI绘画大模型技术

    👉腾小云导读 2022年来,AIGC概念迅速出圈并快速形成产业生态,成为继PGC、UGC之后新的数字内容创作形式。QQ影像中心提出了自研的AI画画技术方案——QQGC,本文将介绍在QQGC基础大模型训练中的实践和探索,接着往下看吧~ 👉 看目 录 点收藏,随时涨技术 1 背景     1.1 扩

    2024年02月09日
    浏览(22)
  • 揭秘AI魔法绘画:Stable Diffusion引领无限创意新纪元

    随着科技的飞速发展,人工智能已经渗透到我们生活的方方面面。在艺术领域,AI技术的应用也日益广泛,为我们带来了前所未有的视觉体验。今天,我们将探讨一种名为Stable Diffusion的AI魔法绘画技术,它如何挑战无限可能,为艺术家和设计师提供全新的创作空间。 首先,让

    2024年02月05日
    浏览(49)
  • 神经网络学习笔记6——生成式AI绘画背后的的GAN与Diffusion初解

    AI绘画,目前AI领域里最有话题性的技术,上一个这么火的话题是swin transformer网络,而2022年8月Jason Allen凭借AI绘画作品《太空歌剧院》拿下科罗拉多州博览会美术竞赛一等奖,瞬间引爆社会争论。后来10月19日,Jasper.ai 宣布完成了 1.25 亿美元的A 轮融资,估值达到了 15 亿美金,

    2024年02月03日
    浏览(25)
  • 【附教程】亲身体验AI绘画的艺术之旅——EP0

    Midjourney 是一个由同名研究实验室开发的人工智能程序,可根据文本生成图像,于2022年7月12日进入公开测试阶段,用户可透过 Discord 的机器人指令进行操作。该研究实验室由 Leap Motion 的创办人大卫·霍尔兹负责领导。—— Wikipedia 可以加入 Beta 计划从 Discord 群中向机器人提交

    2024年02月08日
    浏览(24)
  • AI绘画创意文字全流程揭秘,你的终极文字艺术实操宝典

    本教程收集于:AIGC从入门到精通教程汇总 AIGC技术不断更新迭代,国内出现了越来越多的新玩法,比如最近大家都在热议的AI绘画创意文字。 过去的一周,我把这些新玩法都研究了一遍,并总结了一套完整的制作流程。 主流的创意文字玩法主要分为四类: 光影文字 嵌入文字

    2024年02月13日
    浏览(37)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包