AI创作教程之从 Youtube平台视频剪辑生成新闻文章基于OpenAI Whisper、OpenAI GPT3 和 Stable Diffusion

这篇具有很好参考价值的文章主要介绍了AI创作教程之从 Youtube平台视频剪辑生成新闻文章基于OpenAI Whisper、OpenAI GPT3 和 Stable Diffusion。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

在这篇文章中，我想展示如何借助不同的软件工具从 Youtube 上发布的新闻剪辑中全自动生成包含文本和图像的新闻文章。使用当前用于处理媒体数据的 AI 模型，例如 OpenAI Whisper、OpenAI GPT3 和 Stable Diffusion。

OpenAI Whisper 是最近发布的模型，用于将音频数据转换为具有前所未有质量的书面文本。它已作为开源软件免费提供，并可作为 Python 库下载，网址为

https://github.com/openai/whisper

大语言模型中的经典“GPT3”并非免费提供，但可以通过付费 API 集成。我在这里使用它来创建一个简短的摘要，其中包含基本新闻事实和提取文本的新闻标题。

处理的第三部分是为帖子创建图像。我不使用 Youtube 视频中的任何帧，而是在生成图像模型的帮助下创建合成图像。在这里，我没有使用 OpenAI 变体“Dalle 2”，它也可以通过付费 API 获得，而是使用开源替代品“Stable Diffusion”。这可以从 Github 在

https://github.com/CompVis/stable-diffusion

Youtube视频的提取和文本的提取

为了使用 Python 访问 Youtube 视频的内容，我使用包“PyTube”

https://github.com/pytube/pytube

以下代码通过 BBC 新闻下载视频的音频部分并将其保存到文件中。文章来源地址https://www.toymoban.com/news/detail-502562.html

from pytube import YouTube

stream = YouTube('https://www.youtube.com/watch?v=oaNwxtLKyk0').

到了这里，关于AI创作教程之从 Youtube平台视频剪辑生成新闻文章基于OpenAI Whisper、OpenAI GPT3 和 Stable Diffusion的文章就介绍完了。如果您还想了解更多内容，请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章，希望大家以后多多支持TOY模板网！