科研中论文常见数学符号及其含义(科研必备,建议收藏)

这篇具有很好参考价值的文章主要介绍了科研中论文常见数学符号及其含义(科研必备,建议收藏)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

论文常见数学符号及其含义(科研必备)

返回论文和资料目录

数学符号在数学领域是非常重要的。在论文中,使用数学符号可以使得论文更加简洁明了,同时也能够准确地描述各种概念和理论。在本篇博客中,我将介绍一些常见的数学符号及其含义(省去特别简单的符号),希望能够帮助读者更好地理解数学论文。

高等数学

∑ i = 1 n x i \sum_{i=1}^n x_i i=1nxi (求和符号):表示将 x 1 , x 2 , … , x n x_1,x_2,\dots,x_n x1,x2,,xn 中的所有数相加,例如 ∑ i = 1 n x i \sum_{i=1}^n x_i i=1nxi 表示将 x 1 , x 2 , … , x n x_1,x_2,\dots,x_n x1,x2,,xn 中的所有数相加。

∏ i = 1 n x i \prod_{i=1}^n x_i i=1nxi (乘积符号):表示将 x 1 , x 2 , … , x n x_1,x_2,\dots,x_n x1,x2,,xn 中的所有数相乘,例如 ∏ i = 1 n x i \prod_{i=1}^n x_i i=1nxi 表示将 x 1 , x 2 , … , x n x_1,x_2,\dots,x_n x1,x2,,xn 中的所有数相乘。

lim ⁡ x → a \lim_{x\rightarrow a} limxa (极限符号):表示函数在 x x x 趋近于 a a a 时的极限值,例如 lim ⁡ x → a f ( x ) \lim_{x\rightarrow a} f(x) limxaf(x) 表示当 x x x 趋近于 a a a 时,函数 f ( x ) f(x) f(x) 的极限值。

inf ⁡ \inf inf (下确界):表示一组数的下确界。例如 i n f { 1 , 2 , 3 } = 1 inf\{1,2,3\}=1 inf{1,2,3}=1

sup ⁡ \sup sup (上确界):表示一组数的上确界。

± \pm ± (加减号):表示一个数可以是正数或负数,例如 x = ± 5 x=\pm 5 x=±5 表示 x x x 可以是 5 5 5 − 5 -5 5

≡ \equiv (恒等于):表示两个数或表达式相等,例如 x ≡ y x\equiv y xy 表示 x x x y y y 相等。

≠ \neq = (不等于):表示两个数或表达式不相等,例如 x ≠ y x\neq y x=y 表示 x x x 不等于 y y y

\sqrt{}
这个符号表示平方根。例如, 4 = 2 \sqrt{4}=2 4 =2,表示4的平方根为2。

∞ \infty
这个符号表示无穷大,表示一个数或值趋近于无穷大。例如, lim ⁡ x → ∞ 1 x = 0 \lim_{x\to\infty}\frac{1}{x}=0 limxx1=0 表示当 x x x 趋近于无穷大时, 1 x \frac{1}{x} x1 的极限值为0。

∇ \nabla (梯度):表示多元函数在某一点处的梯度,是一个向量。

∂ \partial (偏导数):表示多元函数的偏导数。

∫ \int (积分):表示求函数在某个区间上的积分值。

∮ \oint (环积分):表示在一个封闭曲线上的积分值。

∬ \iint (二重积分符号):表示对二元函数进行积分运算,例如 ∬ D f ( x , y ) d x d y \iint_{D} f(x,y) dxdy Df(x,y)dxdy 表示对函数 f ( x , y ) f(x,y) f(x,y) 在平面区域 D D D 上进行积分运算。

∭ \iiint (三重积分符号):表示对三元函数进行积分运算,例如 ∭ E f ( x , y , z ) d x d y d z \iiint_{E} f(x,y,z) dxdydz Ef(x,y,z)dxdydz 表示对函数 f ( x , y , z ) f(x,y,z) f(x,y,z) 在空间区域 E E E 上进行积分运算。

∮ \oint (曲线积分符号):表示对曲线上的函数进行积分运算,例如 ∮ C f ( x , y ) d s \oint_{C} f(x,y) ds Cf(x,y)ds 表示对函数 f ( x , y ) f(x,y) f(x,y) 沿曲线 C C C 进行积分运算。

∭ Ω \iiint_{\Omega} Ω (三重积分符号带限制):表示对三元函数在特定区域 Ω \Omega Ω 上进行积分运算,例如 ∭ x 2 + y 2 + z 2 ≤ R 2 f ( x , y , z ) d x d y d z \iiint_{x^2+y^2+z^2 \leq R^2} f(x,y,z) dxdydz x2+y2+z2R2f(x,y,z)dxdydz 表示对函数 f ( x , y , z ) f(x,y,z) f(x,y,z) 在球体 x 2 + y 2 + z 2 ≤ R 2 x^2+y^2+z^2 \leq R^2 x2+y2+z2R2 上进行积分运算。

排列组合

n ! n! n! (阶乘符号):表示自然数 n n n 的阶乘,即 n ! = n × ( n − 1 ) × ⋯ × 1 n!=n\times(n-1)\times\cdots\times1 n!=n×(n1)××1

( n k ) \binom{n}{k} (kn) (组合数符号):表示从 n n n 个元素中选出 k k k 个元素的组合数,即 ( n k ) = n ! k ! ( n − k ) ! \binom{n}{k}=\frac{n!}{k!(n-k)!} (kn)=k!(nk)!n!。例如 ( 5 2 ) \binom{5}{2} (25) 表示从 5 5 5 个元素中选取 2 2 2 个元素的组合数,即 C ( 5 , 2 ) C(5,2) C(5,2)

P n k P_n^k Pnk (排列数符号):表示从 n n n 个元素中选出 k k k 个元素的排列数,即 P n k = n ( n − 1 ) ⋯ ( n − k + 1 ) P_n^k=n(n-1)\cdots(n-k+1) Pnk=n(n1)(nk+1)

C n k C_n^k Cnk (二项式系数符号):表示二项式 ( a + b ) n (a+b)^n (a+b)n 的展开式中第 k k k 项的系数,即 C n k = ( n k ) C_n^k=\binom{n}{k} Cnk=(kn)

∑ k = 0 n \sum_{k=0}^n k=0n (求和符号):表示对序列 a k k = 0 n {a_k}{k=0}^n akk=0n 中的元素进行求和运算,即 ∑ k = 0 n a k = a 0 + a 1 + ⋯ + a n \sum{k=0}^n a_k=a_0+a_1+\cdots+a_n k=0nak=a0+a1++an

∏ k = 1 n \prod_{k=1}^n k=1n (乘积符号):表示对序列 a k k = 1 n {a_k}{k=1}^n akk=1n 中的元素进行乘积运算,即 ∏ k = 1 n a k = a 1 × a 2 × ⋯ × a n \prod{k=1}^n a_k=a_1\times a_2\times\cdots\times a_n k=1nak=a1×a2××an

( n k ) q \binom{n}{k}_q (kn)q q q q-组合数符号):表示在 q q q-分之一意义下从 n n n 个元素中选出 k k k 个元素的组合数,即 ( n k ) q = ( 1 − q n ) ( 1 − q n − 1 ) ⋯ ( 1 − q n − k + 1 ) ( 1 − q k ) ( 1 − q k − 1 ) ⋯ ( 1 − q ) \binom{n}{k}_q=\frac{(1-q^n)(1-q^{n-1})\cdots(1-q^{n-k+1})}{(1-q^k)(1-q^{k-1})\cdots(1-q)} (kn)q=(1qk)(1qk1)(1q)(1qn)(1qn1)(1qnk+1)

概率论

P ( A ) P(A) P(A) (概率符号):表示事件 A A A 发生的概率,取值范围在 [ 0 , 1 ] [0,1] [0,1] 之间。

E [ X ] E[X] E[X] (期望):表示一个随机变量 X X X 的期望值,也可以写作 E [ X ] \mathbb{E}[X] E[X],例如 E [ X ] E[X] E[X] 表示随机变量 X X X 的期望值。

V a r ( X ) \mathrm{Var}(X) Var(X) (方差):表示一个随机变量 X X X 的方差,例如 V a r ( X ) \mathrm{Var}(X) Var(X) 表示随机变量 X X X 的方差。

C o v ( X , Y ) \mathrm{Cov}(X,Y) Cov(X,Y) (协方差):表示两个随机变量 X X X Y Y Y 的协方差,例如 C o v ( X , Y ) \mathrm{Cov}(X,Y) Cov(X,Y) 表示随机变量 X X X Y Y Y 的协方差。

σ X \sigma_X σX (标准差符号):表示随机变量 X X X 的标准差,是方差的算术平方根。

ρ X , Y \rho_{X,Y} ρX,Y (相关系数符号):表示随机变量 X X X Y Y Y 之间的相关系数,是协方差除以两个随机变量的标准差的积。

∼ \sim (服从符号):表示一个随机变量服从某个概率分布,如 X ∼ N ( μ , σ 2 ) X\sim N(\mu,\sigma^2) XN(μ,σ2) 表示 X X X 服从正态分布,其均值为 μ \mu μ,方差为 σ 2 \sigma^2 σ2

∪ \cup (并符号):表示事件的并集,如 A ∪ B A\cup B AB 表示事件 A A A 和事件 B B B 的并集。

∩ \cap (交符号):表示事件的交集,如 A ∩ B A\cap B AB 表示事件 A A A 和事件 B B B 的交集。

P ( A ∣ B ) P(A|B) P(AB):这是条件概率的最基本表述,表示在事件B发生的前提下,事件 A A A发生的概率。其中,符号“ ∣ | ”表示“给定”的意思, P ( A ∣ B ) P(A|B) P(AB)就是给定B的情况下, A A A发生的概率。

P ( A ∩ B ) P(A∩B) P(AB):这个符号表示事件 A A A和事件 B B B同时发生的概率,其中符号“ ∩ ∩ ”表示交集,也就是 A A A B B B的共同部分。因此, P ( A ∩ B ) P(A∩B) P(AB)就是 A A A B B B都发生的概率。

P ( A ∪ B ) P(A∪B) P(AB):这个符号表示事件 A A A和事件 B B B至少有一个发生的概率,其中符号“ ∪ ∪ ”表示并集,也就是 A A A B B B的全部部分。因此, P ( A ∪ B ) P(A∪B) P(AB)就是 A A A或者 B B B至少一个发生的概率。

P ( A ′ ) P(A') P(A):这个符号表示事件 A A A不发生的概率,也可以写成 P ( n o t A ) P(not A) P(notA)。其中符号“ ′ ' ”表示补集,也就是 A A A的相反情况。

P ( A ∣ B ) = P ( A ∩ B ) / P ( B ) P(A|B) = P(A∩B) / P(B) P(AB)=P(AB)/P(B):这个符号表示条件概率的公式,也是条件概率的定义式。其中, P ( A ∩ B ) P(A∩B) P(AB)表示 A A A B B B同时发生的概率, P ( B ) P(B) P(B)表示 B B B发生的概率, P ( A ∣ B ) P(A|B) P(AB)表示在 B B B发生的情况下, A A A发生的概率。

P ( A ∩ B ) = P ( A ∣ B ) × P ( B ) P(A∩B) = P(A|B) × P(B) P(AB)=P(AB)×P(B):这个符号表示条件概率的乘法公式,也称为贝叶斯公式。其中, P ( A ∣ B ) P(A|B) P(AB)表示在 B B B发生的情况下, A A A发生的概率,P(B)表示B发生的概率,P(A∩B)表示A和B同时发生的概率。

P ( A ∪ B ) = P ( A ) + P ( B ) − P ( A ∩ B ) P(A∪B) = P(A) + P(B) - P(A∩B) P(AB)=P(A)+P(B)P(AB):这个符号表示条件概率的加法公式,也称为容斥原理。其中,P(A)表示A发生的概率,P(B)表示B发生的概率,P(A∩B)表示A和B同时发生的概率,P(A∪B)表示A或者B发生的概率。

P ( A 1 ∩ A 2 ∩ . . . ∩ A n ) = P ( A 1 ) × P ( A 2 ∣ A 1 ) × P ( A 3 ∣ A 1 ∩ A 2 ) × . . . × P ( A n ∣ A 1 ∩ A 2 ∩ . . . ∩ A n − 1 ) P(A1∩A2∩...∩An) = P(A1) × P(A2|A1) × P(A3|A1∩A2) × ... × P(An|A1∩A2∩...∩An-1) P(A1A2...An)=P(A1)×P(A2∣A1)×P(A3∣A1A2)×...×P(AnA1A2...An1):这个符号表示条件概率的乘法公式的扩展,也称为全概率公式。其中, A 1 , A 2 , . . . , A n A1,A2,...,An A1,A2,...,An是一个完备事件组,也就是它们是互斥且构成了整个样本空间,P(A1)表示A1发生的概率, P ( A 2 ∣ A 1 ) P(A2|A1) P(A2∣A1)表示在 A 1 A1 A1发生的情况下, A 2 A2 A2发生的概率, P ( A 3 ∣ A 1 ∩ A 2 ) P(A3|A1∩A2) P(A3∣A1A2)表示在A1和A2同时发生的情况下, A 3 A3 A3发生的概率,以此类推。

常见概率分布介绍

矩阵运算

det ⁡ ( A ) \det(A) det(A) (行列式):表示矩阵 A A A 的行列式,例如 det ⁡ ( A ) \det(A) det(A) 表示矩阵 A A A 的行列式。矩阵行列式(Matrix Determinant)
矩阵行列式是一个标量,可以用于判断矩阵是否可逆,通常也可以用符号“ ∣ A ∣ |A| A”表示矩阵 A A A的行列式。对于一个 n n n阶矩阵 A A A,它的行列式可以通过以下公式计算得出:

∣ A ∣ = ∑ i = 1 n ( − 1 ) i + j a i , j ∣ A i , j ∣ |A| = \sum_{i=1}^{n}(-1)^{i+j}a_{i,j}|A_{i,j}| A=i=1n(1)i+jai,jAi,j

A T A^T AT (转置矩阵):表示矩阵 A A A 的转置矩阵,例如 A T A^T AT 表示矩阵 A A A 的转置矩阵。

A − 1 A^{-1} A1 (逆矩阵):表示矩阵 A A A 的逆矩阵,例如 A − 1 A^{-1} A1 表示矩阵 A A A 的逆矩阵。

A ⋅ B A\cdot B AB (矩阵乘积):表示矩阵 A A A 和矩阵 B B B 的乘积,例如 A ⋅ B A\cdot B AB 表示矩阵 A A A 和矩阵 B B B 的乘积。有时也用 A × B A\times B A×B表示,不过不够标准。

t r ( A ) \mathrm{tr}(A) tr(A):是指矩阵对角线上所有元素的和,通常用符号“ t r ( A ) \mathrm{tr}(A) tr(A)”表示矩阵 A A A的迹。对于一个 n n n阶方阵 A A A,它的迹可以用以下公式计算得出:

t r ( A ) = ∑ i = 1 n a i , i \mathrm{tr}(A) = \sum_{i=1}^{n}a_{i,i} tr(A)=i=1nai,i

∥ A ∥ \Vert A \Vert A:表示矩阵 A A A的范数。常见的矩阵范数有以下几种:

第一范数( L 1 L_1 L1范数): ∥ A ∥ 1 = max ⁡ j ∑ i = 1 n ∣ a i , j ∣ \Vert A \Vert_1 = \max_{j}\sum_{i=1}^{n}|a_{i,j}| A1=maxji=1nai,j
第二范数( L 2 L_2 L2范数): ∥ A ∥ 2 = λ max ⁡ ( A T A ) \Vert A \Vert_2 = \sqrt{\lambda_{\max}(A^{\mathrm{T}}A)} A2=λmax(ATA)
无穷范数( L ∞ L_{\infty} L范数): ∥ A ∥ ∞ = max ⁡ i ∑ j = 1 n ∣ a i , j ∣ \Vert A \Vert_{\infty} = \max_{i}\sum_{j=1}^{n}|a_{i,j}| A=maxij=1nai,j
其中, λ max ⁡ ( A T A ) \lambda_{\max}(A^{\mathrm{T}}A) λmax(ATA)表示矩阵 A T A A^{\mathrm{T}}A ATA的最大特征值。

r a n k ( A ) \mathrm{rank}(A) rank(A):矩阵秩(Matrix Rank)是指矩阵中所有线性无关的行向量或列向量的个数,通常用符号“ r a n k ( A ) \mathrm{rank}(A) rank(A)”表示矩阵 A A A的秩。矩阵的秩可以通过高斯消元法或奇异值分解等方法计算得出。

逻辑符号

∀ \forall (全称量词):表示“对于所有的”。

∃ \exists (存在量词):表示“存在”。

∈ \in (属于):表示某个元素属于某个集合,例如 x ∈ S x\in S xS 表示 x x x 属于集合 S S S

⊆ \subseteq (子集或相等):表示一个集合包含在另一个集合中或两个集合相等,例如 S 1 ⊆ S 2 S_1\subseteq S_2 S1S2 表示集合 S 1 S_1 S1 包含在集合 S 2 S_2 S2 中。

∪ \cup (并集):表示两个集合的并集,例如 S 1 ∪ S 2 S_1\cup S_2 S1S2 表示由 S 1 S_1 S1 S 2 S_2 S2 中所有元素构成的集合。

∩ \cap (交集):表示两个集合的交集,例如 S 1 ∩ S 2 S_1\cap S_2 S1S2 表示同时属于 S 1 S_1 S1 S 2 S_2 S2 的元素构成的集合。

⇒ \Rightarrow (蕴含):表示逻辑上的蕴含关系,例如 A ⇒ B A\Rightarrow B AB 表示如果 A A A 成立,则 B B B 也一定成立。

⇔ \Leftrightarrow (等价):表示逻辑上的等价关系,例如 A ⇔ B A\Leftrightarrow B AB 表示 A A A B B B 是等价的。

∼ \sim (取反):表示逻辑上的否定,例如 ∼ A \sim A A 表示 A A A 不成立。

⊕ \oplus (异或):表示逻辑上的异或关系,例如 A ⊕ B A\oplus B AB 表示 A A A B B B 中恰有一个成立。

→ \rightarrow (箭头):表示一个数、向量、函数等的趋势或者变化方向,例如 f ( x ) → ∞ f(x)\rightarrow \infty f(x) 表示 x x x 趋向于无穷大时, f ( x ) f(x) f(x) 趋向于正无穷。

∀ i = 1 n \forall_{i=1}^n i=1n (全称量词带下标):表示对于一个有限个数的序列或集合中的所有元素,例如 ∀ i = 1 n x i > 0 \forall_{i=1}^n x_i > 0 i=1nxi>0 表示对于 n n n 个数 x 1 , x 2 , … , x n x_1,x_2,\dots,x_n x1,x2,,xn,每个数都大于 0 0 0

→ \rightarrow (蕴含符号):在逻辑学和数学中,表示一个命题中的“如果…那么”。

∴ \therefore (因此):表示推理的结论。

□ \Box (证毕符号):表示证明结束,证明得证。

论文实战

1. X ∈ R n 1 × n 2 X \in \mathbb{R}^{n_1 \times n_2} X∈Rn1​×n2​

表示 X X X 是一个 n 1 n_1 n1 n 2 n_2 n2 列的矩阵,其中 R \mathbb{R} R 表示实数集合,即 X X X 的元素都属于实数集合。矩阵的元素可以是实数,也可以是复数,具体取决于具体的上下文。

2. vec ⁡ ( X ) \operatorname{vec}(X) vec(X)

表示将矩阵 X X X 按列展开成一个向量。具体来说,如果矩阵 X X X 是一个 n 1 × n 2 n_1 \times n_2 n1×n2 的矩阵,那么 vec ⁡ ( X ) \operatorname{vec}(X) vec(X) 是一个 n 1 n 2 × 1 n_1n_2 \times 1 n1n2×1 的列向量,其元素按列排列,即 vec ⁡ ( X ) = [ x 1 , 1 , x 2 , 1 , … , x n 1 , 1 , x 1 , 2 , … , x n 1 , n 2 ] ⊤ \operatorname{vec}(X) = [x_{1,1}, x_{2,1}, \dots, x_{n_1,1}, x_{1,2}, \dots, x_{n_1,n_2}]^\top vec(X)=[x1,1,x2,1,,xn1,1,x1,2,,xn1,n2],其中 ⊤ \top 表示向量的转置操作。
v e c ( X ) = [ x 11 x 21 ⋮ x n 1 x 12 x 22 ⋮ x n 2 ⋮ x n 1 n 2 ] vec(\mathbf{X}) = \begin{bmatrix} x_{11} \\ x_{21} \\ \vdots \\ x_{n1} \\ x_{12} \\ x_{22} \\ \vdots \\ x_{n2} \\ \vdots \\ x_{n_1n_2} \end{bmatrix} vec(X)= x11x21xn1x12x22xn2xn1n2

3. K ∈ R n 1 n 2 × n 1 n 2 K \in \mathbb{R}^{n_1n_2 \times n_1n_2} K∈Rn1​n2​×n1​n2​

表示一个 n 1 n 2 n_1n_2 n1n2 n 1 n 2 n_1n_2 n1n2 列的实数矩阵。这种表示法通常在涉及到向量化操作时出现,它可以将一个二维的矩阵映射到一个一维的向量,方便我们进行一些数学运算和处理。例如,如果我们对一个 n 1 × n 2 n_1 \times n_2 n1×n2 的矩阵进行向量化操作,得到的向量的长度为 n 1 n 2 n_1n_2 n1n2,我们可以用一个 n 1 n 2 × n 1 n 2 n_1n_2 \times n_1n_2 n1n2×n1n2 的矩阵 K K K 来表示这个向量。具体来说, K K K 的每一行可以看作是一个原始矩阵中的一个元素,而每一列可以看作是一个向量化后的矩阵中的一个元素。例如,如果原始矩阵 X X X 中的第 ( i , j ) (i,j) (i,j) 个元素为 x i , j x_{i,j} xi,j,那么对应的向量化后的矩阵中的第 k k k 个元素为 x i , j x_{i,j} xi,j,其中 k = ( j − 1 ) n 1 + i k = (j-1)n_1 + i k=(j1)n1+i。因此, K K K 的第 k k k 行第 l l l 列的元素可以表示为 K k , l = δ i , l δ j , k K_{k,l} = \delta_{i,l}\delta_{j,k} Kk,l=δi,lδj,k,其中 δ \delta δ 表示克罗内克(Kronecker)δ符号,满足当 i = l i = l i=l j = k j = k j=k 时取值为 1,否则取值为 0。

4. ⊗

通常表示 Kronecker积(Kronecker product)运算。Kronecker积是一种基于矩阵的张量积(tensor product)扩展的一种运算,它将两个矩阵 A ∈ R m × n A \in \mathbb{R}^{m \times n} ARm×n B ∈ R p × q B \in \mathbb{R}^{p \times q} BRp×q 分别按元素逐一相乘,并按照矩阵的形式进行组合,得到一个新的矩阵 C ∈ R m p × n q C \in \mathbb{R}^{mp \times nq} CRmp×nq,具体地:

C = A ⊗ B = [ a 11 B ⋯ a 1 n B ⋮ ⋱ ⋮ a m 1 B ⋯ a m n B ] C = A \otimes B = \begin{bmatrix} a_{11}B & \cdots & a_{1n}B \\ \vdots & \ddots & \vdots \\ a_{m1}B & \cdots & a_{mn}B \\ \end{bmatrix} C=AB= a11Bam1Ba1nBamnB

其中, a i j a_{ij} aij 表示矩阵 A A A 中的第 i i i 行第 j j j 列的元素, B B B 表示一个 p × q p \times q p×q 的矩阵, a i j B a_{ij}B aijB 表示将矩阵 B B B 的每个元素都乘以 a i j a_{ij} aij,得到一个 p × q p \times q p×q 的矩阵。Kronecker积的一个重要应用是在线性代数和信号处理领域中。它可以用来表示矩阵的重复和扩展,从而简化一些复杂的运算和计算。例如,当我们需要对两个向量进行外积运算时,可以使用 Kronecker积来简化计算;在卷积神经网络中,可以使用 Kronecker积来表示卷积操作和池化操作;在信号处理中,可以使用 Kronecker积来表示多维信号的卷积和相关操作等。

5. π R L ( y ∣ x ) \pi^{RL}(y|x) πRL(y∣x)

在强化学习中,通常表示在一个给定的状态 x x x 下,智能体在执行强化学习任务时采取动作 y y y 的概率。具体来说, π R L ( y ∣ x ) \pi^{RL}(y|x) πRL(yx) 是一个策略函数(policy function),它描述了智能体如何根据环境的状态来选择动作。在强化学习中,一个智能体通常通过与环境的交互来学习策略函数,即根据当前状态选择一个最优的动作,从而最大化累积奖励(cumulative reward)。因此,策略函数的设计和优化是强化学习中的一个核心问题。需要注意的是, π R L ( y ∣ x ) \pi^{RL}(y|x) πRL(yx) 的具体形式和实现方式因任务和算法而异。在某些情况下,策略函数可以直接通过映射状态到动作的函数来表示,例如 π R L ( y ∣ x ) = f ( x ) \pi^{RL}(y|x)=f(x) πRL(yx)=f(x);在其他情况下,策略函数可能需要根据一些参数或价值函数来决定动作,例如 π R L ( y ∣ x ) = softmax ( f θ ( x ) ) \pi^{RL}(y|x)=\text{softmax}(f_\theta(x)) πRL(yx)=softmax(fθ(x)),其中 f θ ( x ) f_\theta(x) fθ(x) 表示带有参数 θ \theta θ 的函数。

6. d i a g ( x ) diag(\mathbf{x}) diag(x)

在论文中, d i a g ( x ) diag(\mathbf{x}) diag(x) 表示将向量 x \mathbf{x} x 的每个元素放在一个对角线上,其余位置为零的对角矩阵,即:

d i a g ( x ) = [ x 1 0 ⋯ 0 0 x 2 ⋯ 0 ⋮ ⋮ ⋱ ⋮ 0 0 ⋯ x n ] diag(\mathbf{x}) = \begin{bmatrix} x_1 & 0 & \cdots & 0 \\ 0 & x_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & x_n \end{bmatrix} diag(x)= x1000x2000xn

v e c ( X ) vec(\mathbf{X}) vec(X) 表示将矩阵 X \mathbf{X} X 按列展开成一个列向量,即:

v e c ( X ) = [ x 11 x 21 ⋮ x n 1 x 12 x 22 ⋮ x n 2 ⋮ x n 1 n 2 ] vec(\mathbf{X}) = \begin{bmatrix} x_{11} \\ x_{21} \\ \vdots \\ x_{n1} \\ x_{12} \\ x_{22} \\ \vdots \\ x_{n2} \\ \vdots \\ x_{n_1n_2} \end{bmatrix} vec(X)= x11x21xn1x12x22xn2xn1n2

因此, d i a g ( v e c ( K p ) ) diag(vec(\mathbf{K}_p)) diag(vec(Kp)) 表示将矩阵 K p \mathbf{K}_p Kp 按列展开成一个列向量后,将其放在一个对角线上,其余位置为零的对角矩阵,即:

d i a g ( v e c ( K p ) ) = [ K p , 11 K p , 21 ⋱ K p , n 1 n 2 , n 1 n 2 ] diag(vec(\mathbf{K}_p)) = \begin{bmatrix} \mathbf{K}_{p,11} \\ & \mathbf{K}_{p,21} \\ & & \ddots \\ & & & \mathbf{K}_{p,n_1n_2,n_1n_2} \end{bmatrix} diag(vec(Kp))= Kp,11Kp,21Kp,n1n2,n1n2

其中 K p , i j \mathbf{K}_{p,ij} Kp,ij 表示矩阵 K p \mathbf{K}_p Kp 中第 i i i 行、第 j j j 列的元素。

7. π : [ 1 , d ] → [ 1 , d ] \pi : [1, d] \rightarrow [1, d] π:[1,d]→[1,d]

表示一个从区间 [ 1 , d ] [1, d] [1,d] 到自身的映射,也就是一个自同态。其中 [ 1 , d ] [1, d] [1,d] 表示包含从 1 1 1 d d d 所有整数的闭区间。

这个映射通常用来表示一种数据的排列方式,例如排列矩阵的行或列。具体而言,对于一个 d d d 维向量 x = ( x 1 , x 2 , ⋯   , x d ) \mathbf{x} = (x_1, x_2, \cdots, x_d) x=(x1,x2,,xd) π ( x ) \pi(\mathbf{x}) π(x) 表示对 x \mathbf{x} x 进行排列后的结果。在实际应用中,这种排列方式通常与某种特定的数据结构或算法相关。

需要注意的是,虽然符号 π \pi π 在一些特定的上下文中可能有不同的含义,但是在不同的文献中可能存在差异,需要具体根据文献背景来理解。

8. π 1 ∘ π 2 \pi_1 \circ \pi_2 π1​∘π2​

表示函数合成,也就是将函数 π 2 \pi_2 π2 的输出作为函数 π 1 \pi_1 π1 的输入,然后输出 π 1 \pi_1 π1 的结果。具体来说,对于两个从区间 [ 1 , d ] [1,d] [1,d] 到自身的映射 π 1 \pi_1 π1 π 2 \pi_2 π2,符号 π 1 ∘ π 2 \pi_1 \circ \pi_2 π1π2 定义如下:

( π 1 ∘ π 2 ) ( i ) = π 1 ( π 2 ( i ) ) , i = 1 , 2 , ⋯   , d . (\pi_1 \circ \pi_2)(i) = \pi_1(\pi_2(i)), \qquad i = 1, 2, \cdots, d. (π1π2)(i)=π1(π2(i)),i=1,2,,d.

这个符号在某些场景下可以用来表示对一个多维数组进行多次排列的结果。比如,对于一个形状为 n × d n \times d n×d 的矩阵 X \mathbf{X} X,可以使用 π 1 ∘ π 2 \pi_1 \circ \pi_2 π1π2 来表示先对矩阵的行进行排列,再对排列后的结果的列进行排列得到的新矩阵。具体来说,假设 X i , j \mathbf{X}_{i,j} Xi,j 表示矩阵 X \mathbf{X} X 中第 i i i 行第 j j j 列的元素, π 1 \pi_1 π1 表示行的排列方式, π 2 \pi_2 π2 表示列的排列方式,则排列后的矩阵可以表示为:

( π 1 ∘ π 2 ) ( X ) i , j = X π 1 ( π 2 ( i ) ) , π 2 ( j ) . (\pi_1 \circ \pi_2)(\mathbf{X}){i,j} = \mathbf{X}{\pi_1(\pi_2(i)), \pi_2(j)}. (π1π2)(X)i,j=Xπ1(π2(i)),π2(j).

需要注意的是,符号 π 1 ∘ π 2 \pi_1 \circ \pi_2 π1π2 通常要满足结合律,即 ( π 1 ∘ π 2 ) ∘ π 3 = π 1 ∘ ( π 2 ∘ π 3 ) (\pi_1 \circ \pi_2) \circ \pi_3 = \pi_1 \circ (\pi_2 \circ \pi_3) (π1π2)π3=π1(π2π3),但是在某些特定的场景下,这个条件可能不满足,需要具体根据上下文来理解。

9. f : S d → R f : S_d \to R f:Sd​→R

表示定义在置换群 S d S_d Sd上,取值为实数 R R R中的函数 f f f,即 f f f完成了 S d S_d Sd R R R空间的映射。其中 S d S_d Sd是由 d d d个元素的置换组成的群(d个元素的排列组合),通常也称为对称群。在机器学习中,置换群通常用于处理具有对称性质的问题,例如图像识别、图像处理等。函数 f f f可以是任意函数,例如特征函数、损失函数等。文章来源地址https://www.toymoban.com/news/detail-424470.html

如果读者在论文中有遇到不懂的符号,欢迎留言评论或私聊。

到了这里,关于科研中论文常见数学符号及其含义(科研必备,建议收藏)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • =>符号含义

    =主要有两方面的作用,一个限制属性状态,另一个简化匿名委托和Lambda 用法一:定义只读属性 public string Sex = \\\"男\\\"; 这里=的用法相当于 { get; } = 即:将Sex字段设置为了只读属性,同时进行了赋值。 public string Sex { get;  } = \\\"男\\\" 用法二:Lambda表达式,匿名委托 例如定

    2024年02月09日
    浏览(37)
  • C++中的##、#符号含义

    在C++中, ## 和 # 是两个不同的 预处理符号 。这些符号都是在C++的预处理阶段使用的,用于在代码编译之前对 文本 进行操作。 # (字符串化操作符): 用于将 宏参数 转换为 字符串常量 。 ## (连接操作符):用于将 两个宏参数连接在一起 ,仅仅是连接在一起,它并不知道

    2024年02月09日
    浏览(37)
  • 常用电源符号含义分享

    电源符号,你是否还傻傻分不清楚?常用电源符号附上! 在电路设计中,总会出现各式各样的电源符号,经常会把人弄懵逼,今天小编整理了二十多个比较常用的电源符号分享给大家,快收藏呀。   1.V BB : B可以认为是三极管的基极B,一般是指电源正极。 2.V CC :C可以认为

    2024年01月16日
    浏览(44)
  • 【考研数学】概率论与数理统计 —— 第二章 | 一维随机变量及其分布(2,常见随机变量及其分布 | 随机变量函数的分布)

    承接前文,我们继续学习第二章,一维随机变量及其分布的第二部分内容。 (一)(0-1)分布 设随机变量 X X X 的可能取值为 0 或 1 ,且其概率为 P P P { X = 1 X=1 X = 1 } = p , =p, = p , P P P { X = 0 X=0 X = 0 } = 1 − p ( 0 p 1 =1-p(0 p 1 = 1 − p ( 0 p 1 ,称 X X X 服从(0-1)分布,记为 X ∼ B

    2024年02月11日
    浏览(47)
  • Linux 终端特殊符号含义大全

    Linux 终端中有许多特殊符号,本文对常用的进行了总结: $ 表示变量/普通终端用户:用于引用变量的值/表示终端中的普通用户。 # 表示注释/超级用户:用于在脚本中注释代码/表示终端中的超级用户。 / :根目录/目录分隔符。 ~ :当前用户的主目录。 . :当前目录。 .. :上

    2024年02月11日
    浏览(44)
  • 【考研数学】概率论与数理统计 —— 第二章 | 一维随机变量及其分布(1,基本概念与随机变量常见类型)

    暑假接近尾声了,争取赶一点概率论部分的进度。 设随机试验 E E E 的样本空间为 Ω Omega Ω , X X X 为定义于样本空间 Ω Omega Ω 上的函数,对于任意 w ∈ Ω w in Omega w ∈ Ω ,总存在唯一确定的 X ( w ) X(w) X ( w ) 与之对应,称 X ( w ) X(w) X ( w ) 为随机变量,一般记为 X X X 。 随机

    2024年02月11日
    浏览(46)
  • 科研必备—Grammarly安装及下载

    1.官网下载Grammarly office版本,用于后续嵌入到word中: 打开apps后,却发现没有 Grammarly for Microsoft Office 下面提供一个 Grammarly for Microsoft Office 的下载方法: 下载完毕后 ,安装时可能会出现 Error: Grammarly add-in has failed to load ,可通过如下链接来进行解决: 红框中的步骤尤为重要

    2024年02月11日
    浏览(50)
  • python中的运算符号含义,python基本运算符的操作

    本篇文章给大家谈谈python的运算符号有哪些类型,以及python各运算符号的功能说明,希望对各位有所帮助,不要忘了收藏本站喔。 1.算数运算符(最常见的)     标准算数运算符(加减乘除)     取余运算符     幂运算符 2.赋值运算符 3.比较运算符 4.布尔运算符 5.位运算符

    2024年02月13日
    浏览(58)
  • C 语言中宏定义中指定数据类型, U、L、F等符号含义

    一、引言 代码中可以直接定义一个变量是可以指定变量数据类型,宏定义中也可以实现数据量类型的指定。 现在我们定义一个宏变量#define NUM 5,这个数字5是以什么类型存储的呢?答案是signed int。我们再这样定义一个宏变量#define NUM 5LL,此时的数字5又是以什么类型存储的呢

    2024年02月15日
    浏览(44)
  • 【科研入门】会议、期刊、出版社、文献数据库、引文数据库、SCI分区、影响因子等基础科研必备知识

    大家好,我是洲洲,欢迎关注,一个爱听周杰伦的程序员。关注公众号【程序员洲洲】即可获得10G学习资料、面试笔记、大厂独家学习体系路线等…还可以加入技术交流群欢迎大家在CSDN后台私信我! 会议论文一定是针对某个学术会议投稿,并且由学术会议的会务组决定是否

    2024年02月11日
    浏览(61)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包