用人工智能压缩视频的尝试

这篇具有很好参考价值的文章主要介绍了用人工智能压缩视频的尝试。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

开始

设计一个神经元网络,它有(x, y, t)三个输入,有(R, G, B)三个输出,中间有许多隐藏层。x和y是视频的横纵坐标,t是帧数。输入(x, y, t),输出一个像素,即(R, G, B)。

2K视频为2048×1080分辨率,2小时的视频大约3.0GB。取其1%作为神经元网络的预期压缩率,即30MB。

以前的博客中有8比特神经元网络的设想,那么,30MB的神经元网络,有3000万个参数。

运算量估计

设视频每秒24帧,运行一次神经元网络需要与参数个数相同的运算量,即3000万。
2048×1080×24×3000万=1.6Pflops

现有的个人电脑不支持这么大的运算能力,也许这是属于未来的技术吧?

上述运算量是播放时的,下面估算训练时的。

神经元网络中参数个数n=3000万
训练样本的个数m=2048×1080×24×7200=3822亿
训练几轮呢?p=100
总的运算量=pmn2=34398亿亿亿次
以最先进的百亿亿次超算,需要1091年!

处理小视频

这也太长了,不如先对小视频进行压缩。设视频为100×100像素,24帧/秒,15秒。设它有一万分之一的压缩率,则n=1080。它的训练量是多少呢?

p=100,m=100×100×24×15=360万,n=1080
训练运算量=420万亿次
播放运算量=100×100×24×1080=260Mflops
这还在可以接受的范围内。

结论

建立一个神经元网络,它有(x, y, t)输入,(R, G, B)输出。对一个100×100像素,每秒24帧,15秒的小视频进行压缩。播放时,依次输入(x, y, t=1),得到1帧图像,改变t,得到连续的视频。

对200×200像素的视频,训练运算量为6次方,即64倍;播放运算量为4次方,即16倍;同时,训练运算量是时间的2次方;播放运算量是时间的1次方。文章来源地址https://www.toymoban.com/news/detail-412712.html

到了这里,关于用人工智能压缩视频的尝试的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • “初学者必看:如何从零开始学习人工智能?

    当我初次接触人工智能(AI)时,正值 AlphaGo 战胜围棋世界冠军李世石成为全球焦点,那一刻,人工智能这项技术首次闯入我的视线。我对此产生了浓厚兴趣,决心探究其背后的原理以及这些技术能为我们带来何种益处。于是我开始搜集资料,观看视频,深入了解相关知识。

    2024年01月24日
    浏览(57)
  • 从零开始:如何用Python建立你的第一个人工智能模型

    在这篇文章中,我们将介绍如何 从零开始使用Python建立你的第一个人工智能模型 。无论你是刚接触编程的新手,还是有经验的开发者想进一步探索人工智能领域,这篇文章都将为你提供清晰、详细的指南。我们将一步步探索数据预处理、模型建立、训练和测试的过程,以及

    2024年02月09日
    浏览(50)
  • 【人工智能】大模型的本质:在超高维空间上对人类全部知识的高度压缩映射

    在计算机科学和人工智能领域,大模型成为了当前研究的热门话题之一。大模型通常指拥有上亿参数数量的深度神经网络模型。近年来,GPT-3等巨型自然语言处理模型的出现,引起了广泛的关注和探讨。本文将从理论和实践两个角度,详细介绍大模型的本质和应用。 大模型是

    2024年02月12日
    浏览(50)
  • InVideo AI:用人工智能轻松制作视频

    InVideo AI 是一款在线视频制作工具,使用人工智能来帮助用户快速、轻松地制作高质量的视频。该工具提供多种功能,包括: 链接: ai.invideo.io 历史记录:  创建视频: 选择模板:youtube explainer 加入提示词: 输入时长:15秒 输入标题: 输入正文: 选择背景音乐: 选择性别

    2024年02月09日
    浏览(43)
  • 新质生产力人工智能+系列2:6G时代AI研究-CSI压缩反馈(含任务、数据集、代码、解题思路PPT资源)

            在新质生产力高质量发展的要求下,中国移动在“人工智能+”和 “数据要素X”方面不断发力,持续发布高质量电信数据集。围绕网元智能、运维智能、服务智能三大方向建设,涵盖无线信道、基站、云网、核心网、哑资源等多领域,支持感知、诊断、预测、决策

    2024年03月25日
    浏览(74)
  • AI人工智能一键图片/视频换脸-Roop

    Roop 换脸技术是一种基于深度学习的人脸图像处理技术。 Roop换脸技术的实现主要分为两个步骤: 人脸检测与对齐 、 特征融合与生成 。 1.人脸检测与对齐在Roop换脸技术中,首先需要对输入的图像进行人脸检测与对齐。这一步骤的目的是确保输入的两张图像中的人脸位置和角

    2024年02月13日
    浏览(53)
  • 如何使用生成式人工智能探索视频博客的魅力?

    视频博客,尤其是关于旅游的视频博客,为观众提供了一种全新的探索世界的方式。通过图像和声音的结合,观众可以身临其境地体验到旅行的乐趣和发现的喜悦。而对于内容创作者来说,旅游视频博客不仅能分享他们的旅行故事,还能吸引关注,甚至实现变现。本文将指导

    2024年03月14日
    浏览(60)
  • 视频AI方案:数据+算力+算法,人工智能的三大基石

    随着信息技术的迅猛发展,人工智能(AI)已经逐渐渗透到我们生活的各个领域,从智能家居到自动驾驶,从医疗诊断到金融风控,AI的应用正在改变着我们的生活方式。而数据、算法和算力,正是构成人工智能技术的三大核心要素,它们之间相互关联、相互影响,共同推动着

    2024年04月09日
    浏览(50)
  • 人工智能与人类互动:如何设计一个好的人工智能交互界面?

    作者:禅与计算机程序设计艺术 引言 人工智能(AI)正在改变我们的生活和各行各业。随着 AI 技术的不断发展,越来越多的人开始关注人工智能与人类互动的设计问题。一个好的人工智能交互界面对于用户体验、应用效果以及 AI 的利用率都具有重要意义。在这篇文章中,我

    2024年02月09日
    浏览(64)
  • 陶哲轩也在用的人工智能数学证明验证工具lean [线性代数篇1]从零开始证明矩阵的逆

    我还做了一个视频专门讲解哦,有空支持一下点个赞: 陶哲轩也在用的人工智能数学证明验证工具lean [线性代数篇1]从零开始证明矩阵的逆_哔哩哔哩_bilibili import Paperproof import Mathlib.LinearAlgebra.Matrix.Adjugate import Mathlib.Data.Real.Sqrt -- set_option trace.Meta.synthInstance true -- 要解释每一个

    2024年02月03日
    浏览(61)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包