Csiszár divergences

这篇具有很好参考价值的文章主要介绍了Csiszár divergences。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

Csiszár divergences

熵函数

熵函数(entropy function) φ : R + + → R + \varphi: \mathbb{R}_{++} \to \mathbb{R}_{+} φ:R++R+,他是凸函数,正的(?),下半连续函数,并且 φ ( 1 ) = 0 \varphi \left( 1 \right) = 0 φ(1)=0
φ ∞ ′ = lim ⁡ x → ∞ φ ( x ) x \varphi_{\infty}^{\prime} = \lim_{ x \to \infty } \frac{\varphi \left( x \right)}{x} φ=limxxφ(x)

性质

φ ∗ \varphi^{*} φ是熵函数的共轭函数,则

  1. ∂ φ ⊂ R + \partial \varphi \subset \mathbb{R}_{+} φR+,即 φ ∗ \varphi^{*} φ单调不减
  2. dom ⁡ φ ∗ = ( − ∞ , φ ∞ ′ ) \operatorname{dom}\varphi^{*} = \left( -\infty, \varphi_{\infty}^{\prime} \right) domφ=(,φ)
  3. lim ⁡ q → − ∞ φ ∗ ( q ) = − φ ( 0 ) , lim ⁡ q → + ∞ φ ∗ ( q ) = + ∞ \lim\limits_{q\to -\infty}\varphi^{*} \left( q \right) = -\varphi \left( 0 \right), \lim\limits_{q\to +\infty}\varphi^{*} \left( q \right) = +\infty qlimφ(q)=φ(0),q+limφ(q)=+

证明:
q < q ′ q < q^{\prime} q<q,
由于 dom ⁡ φ = R + + \operatorname{dom} \varphi = \mathbb{R}_{++} domφ=R++,有 x q − φ ( x ) ≤ x q ′ − φ ( x ) xq-\varphi \left(x\right) \le x q^{\prime} - \varphi\left(x\right) xqφ(x)xqφ(x)
两边同时取 sup ⁡ \sup sup,即可证明1

φ ∞ ′ < ∞ \varphi_{\infty}^{\prime} < \infty φ<, 并且 q > φ ∞ ′ q > \varphi_{\infty}^{\prime} q>φ, 则 lim ⁡ p → ∞ ( p q − φ ( p ) ) = lim ⁡ p → ∞ p ( q − φ ( p ) p ) = + ∞ \lim_{ p \to \infty } \left( pq-\varphi \left(p\right) \right) = \lim_{ p \to \infty } p\left(q - \frac{\varphi \left( p \right)}{p} \right) = +\infty limp(pqφ(p))=limpp(qpφ(p))=+,也就是说 q ∉ dom ⁡ ( φ ∗ ) q \notin \operatorname{dom} \left( \varphi^{*} \right) q/dom(φ)
φ ∞ ′ = ∞ \varphi_{\infty}^{\prime} = \infty φ=,则,对于 ∀ q ∈ R \forall q \in \mathbb{R} qR , lim ⁡ p → ∞ p ( q − φ ( p ) p ) = − ∞ \lim_{ p \to \infty } p\left(q - \frac{\varphi \left( p \right)}{p} \right) = -\infty limpp(qpφ(p))=,
也就是说,关于 p p p是一个强制函数,进而 φ ∗ ( p ) \varphi^{*} \left( p \right) φ(p)有限,即 q ∈ dom ⁡ ( φ ∗ ) q \in \operatorname{dom} \left( \varphi^{*} \right) qdom(φ)

显然 φ ∗ ( q ) ≥ − φ ( 0 ) \varphi^{*} \left( q \right) \ge - \varphi \left( 0 \right) φ(q)φ(0)
q → − ∞ q \to -\infty q, 若 p > 0 p >0 p>0,则 p q − φ ( p ) → − ∞ pq-\varphi \left(p\right) \to -\infty pqφ(p),因此 lim ⁡ q → − ∞ φ ∗ ( q ) = − φ ( 0 ) \lim\limits_{q\to -\infty}\varphi^{*} \left( q \right) = -\varphi \left( 0 \right) qlimφ(q)=φ(0)
q → + ∞ q \to +\infty q+ φ ∗ ( q ) ≥ q × 1 − φ ( 1 ) = q \varphi^{*} \left( q \right) \ge q \times 1 - \varphi \left( 1 \right) = q φ(q)q×1φ(1)=q, 进而 lim ⁡ q → + ∞ φ ∗ ( q ) = + ∞ \lim\limits_{q\to +\infty}\varphi^{*} \left( q \right) = +\infty q+limφ(q)=+

定义

考虑数据定义在空间 X \mathcal{X} X上,正测度集 M + ( X ) \mathcal{M}^+ \left( \mathcal{X} \right) M+(X)
Radon-Nikodym-Lebegue decomposition, α = d α d β + α ⊥   ∀ ( α , β ) ∈ M ( X ) \alpha = \frac{\mathrm{d} \alpha}{\mathrm{d} \beta} + \alpha^{\perp}\ \forall \left( \alpha, \beta \right) \in \mathcal{M} \left( \mathcal{X} \right) α=dβdα+α (α,β)M(X)
熵函数 φ \varphi φ,其中定义 ∀ x < 0 , φ ( x ) = + ∞ \forall x < 0, \varphi \left( x \right)= +\infty x<0,φ(x)=+

则Csiszár divergences定义为
D φ ( α ∣ β ) ≜ ∫ X φ ( d α d β ( x ) ) d β ( x ) + φ ∞ ′ ∫ X d α ⊥ ( x ) \mathrm{D}_{\varphi}(\alpha \mid \beta) \triangleq \int_{\mathcal{X}} \varphi\left(\frac{\mathrm{d} \alpha}{\mathrm{d} \beta}(x)\right) \mathrm{d} \beta(x)+\varphi_{\infty}^{\prime} \int_{\mathcal{X}} \mathrm{d} \alpha^{\perp}(x) Dφ(αβ)Xφ(dβdα(x))dβ(x)+φXdα(x)
离散版本
D φ ( μ ∣ ν ) ≜ ∑ ν i > 0 φ ( μ i ν i ) ν i + φ ∞ ′ ∑ ν i = 0 μ i \mathrm{D}_{\varphi}(\mu \mid \nu) \triangleq \sum_{\nu_i>0} \varphi\left(\frac{\mu_i}{\nu_i}\right) \nu_i+\varphi_{\infty}^{\prime} \sum_{\nu_i=0} \mu_i Dφ(μν)νi>0φ(νiμi)νi+φνi=0μi文章来源地址https://www.toymoban.com/news/detail-785218.html

到了这里,关于Csiszár divergences的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 深度学习-必备的数学知识-概率论3

    概率论 我们将接着上一篇文章继续讲解。 条件概率 大家还记得上一篇文章的提到的联合概率分布吗?定义在一组变量的联合概率分布的子集上的概率分布被称为边缘概率分布(marginal probability distribution)。 对于离散型随机变量x和y,如果我们有 P ( x , y ) P(x,y) P ( x , y ) ,则可

    2024年02月03日
    浏览(45)
  • 深度学习-必备的数学知识-概率论4

    概率论 我们将接着上一篇文章继续讲解。 在接下来的文章中,将会把随机变量本身写作大写字母,随机变量的值写作小写字母。 期望、方差和协方差 期望(expectation)是指随机变量X所有可能取值的平均或期望值。期望可以看作随机变量的中心或平均位置。换句话说期望是随

    2024年02月04日
    浏览(45)
  • 【考研数学】概率论与数理统计 | 第一章——随机事件与概率(1)

    若一个试验满足如下条件: 在相同的条件下该试验可重复进行; 试验的结果是多样的且所有可能的结果在试验前都是确定的; 某次试验之前不确定具体发生的结果, 这样的试验称为随机试验,简称试验,一般用字母 E E E 表示。 设 E E E 为随机试验,随机试验 E E E 的 所有

    2024年02月12日
    浏览(51)
  • 概率论--数学期望与方差--协方差(详解)

    目录 数学期望与方差 离散型随机变量的数学期望 注意 连续型随机变量的数学期望          方差 常用随机变量服从的分布  二项分布 正态分布 随机向量与随机变量的独立性 随机向量 随机变量的独立性 协方差 协方差的定义 协方差的意义 协方差矩阵 离散型随机变量的

    2024年02月11日
    浏览(35)
  • 【深度学习】S2 数学基础 P6 概率论

    机器学习本质上,就是做出预测。而概率论提供了一种量化和表达不确定性水平的方法,可以帮助我们量化对某个结果的确定性程度。 在一个简单的图像分类任务中; 如果我们非常确定图像中的对象是一只猫,那么我们可以说标签为 “猫” 的概率是 1,即 P ( y = “猫” )

    2024年02月20日
    浏览(40)
  • 【考研数学】概率论与数理统计 | 第一章——随机事件与概率(2,概率基本公式与事件独立)

    承接上文,继续介绍概率论与数理统计第一章的内容。 P ( A − B ) = P ( A B ‾ ) = P ( A ) − P ( A B ) . P(A-B)=P(A overline{B} )=P(A)-P(AB). P ( A − B ) = P ( A B ) = P ( A ) − P ( A B ) . 证明: A = ( A − B ) + A B A=(A-B)+AB A = ( A − B ) + A B ,且 A − B A-B A − B 与 A B AB A B 互斥,根据概率的有限可加

    2024年02月12日
    浏览(48)
  • 【概率论】连续型随机变量的分布函数及数学期望(一)

    已知F₁(x)和F₂(x)是分布函数,若 aF₁(x)-bF₂(x)也是分布函数,则下列关于常数a,b的选项中正确的是()。 A.a= 3 5 frac{3}{5}

    2024年02月12日
    浏览(46)
  • 【概率论】连续型随机变量的分布函数及数学期望(二)

    如果X的密度函数为 p ( x ) = { x , 0 ≤

    2024年01月18日
    浏览(55)
  • 自动编码器的数学基础:概率论与线性代数

    自动编码器(Autoencoders)是一种深度学习模型,它通过学习压缩输入数据的低维表示,然后再将其重新解码为原始数据形式。自动编码器的主要目的是学习数据的特征表示,从而可以用于降维、生成新数据、数据压缩等应用。在这篇文章中,我们将讨论自动编码器的数学基础,

    2024年02月20日
    浏览(47)
  • 数学模型在人工智能中的使用:统计学和概率论

    数学模型在人工智能中的使用:统计学和概率论 随着人工智能技术的发展,数学模型的重要性越来越突出。数学模型可以帮助人工智能

    2024年02月16日
    浏览(44)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包