量化投资 离散时间随机过程
状态空间 State Space
状态域和事件域
第一句话不知道怎么理解:
The uncertainty is about the realization of state of nature in a state space Ω \Omega Ω.
Ω \Omega Ω :状态空间,其子集叫做事件;
F t \mathcal{F}_t Ft :包括在 t t t 时刻可观测到的所有事件; F ( ω ) t \mathcal{F}(\omega)_t F(ω)t 是某个状态 ω \omega ω 在状态空间 Ω \Omega Ω 中实现时,在时间 t t t 可观测到的事件集合;
性质 Properties:
- F t \mathcal{F}_{t} Ft 构成了 Ω \Omega Ω 上的 σ \sigma σ-代数;
百度百科:
在数学中,某个集合 X X X 上的 σ \sigma σ 代数( σ \sigma σ-algebra)又叫 σ \sigma σ 域 ,是 X X X 的所有子集的集合(也就是幂集)的一个子集。这个子集满足对于可数个集合的并集运算和补集运算的封闭性(因此对于交集运算也是封闭的)。 σ \sigma σ 代数可以用来严格地定义所谓的“可测集”,是测度论的基础概念之一。
- ∀ t \forall \,t ∀t , Ω ∈ F t \Omega\in \mathcal{F}_t Ω∈Ft ;
为了确保概率论的完备性和一致性,我们希望能够考虑所有可能的情况。因此,我们假设整个状态空间 Ω \Omega Ω 是可观测的,即我们可以观察到系统可能处于的任何状态。这意味着在任何给定的时间点 t t t,我们至少能观察到整个状态空间 Ω \Omega Ω,即 Ω ∈ F t \Omega\in \mathcal{F}_t Ω∈Ft
- A ∈ F t A\in \mathcal{F}_t A∈Ft → \to → A c = { ω ∈ Ω : ω ∉ A } ∈ F t A^c=\{\omega\in\Omega:\,\omega\not\in A\}\in \mathcal{F}_t Ac={ω∈Ω:ω∈A}∈Ft ;
这个关系的意义在于,如果我们可以观察到事件 A A A 的发生情况,那么我们也可以观察到事件 A A A 不发生的情况。事件 A A A 和其对立事件 A c A^c Ac 是互补的,它们的可观测性是相互对应的。
这样的关系在概率论中很常见,它们确保了可观测事件集合的完备性和一致性。无论事件 A A A 是否发生,我们总是可以观察到状态空间中的某些状态,因此对立事件 A c A^c Ac 也是可观测的。
- { A n } n = 1 ∞ ⊂ F t → ∪ n = 1 ∞ A n ∈ F t \{A_n\}_{n=1}^{\infty}\subset\mathcal{F}_t \to \cup_{n=1}^{\infty}A_n\in\mathcal{F}_t {An}n=1∞⊂Ft→∪n=1∞An∈Ft ;
这个关系的意义在于,如果一个事件序列中的每个事件都是可观测的,那么它们的并集事件也是可观测的。通过取事件序列的并集,我们仍然可以在时间 t t t 观察到这个组合事件的发生情况。
这个性质在概率论中也非常重要,因为它允许我们考虑无穷个事件的情况。通过确保并集事件属于可观测事件集合,我们可以建立和推断无穷事件序列的可观测性。
-
∀ ω ∈ Ω \forall \omega \in \Omega ∀ω∈Ω , ω ∈ F t ( ω ) \omega \in \mathcal{F}_t{(\omega)} ω∈Ft(ω) ;
-
对于某个时刻,所有的 F t ( ω ) \mathcal{F}_t(\omega) Ft(ω) 构成了 Ω \Omega Ω 的一个划分,也就是对于 ∀ ω , ω ′ \forall \omega,\,\omega' ∀ω,ω′ ,以下之一满足:
-
F t ( ω ) ∩ F t ( ω ′ ) = ∅ \mathcal{F}_t(\omega)\cap\mathcal{F}_t(\omega')=\varnothing Ft(ω)∩Ft(ω′)=∅ ;
-
F t ( ω ) = F t ( ω ′ ) \mathcal{F}_t(\omega)=\mathcal{F}_t(\omega') Ft(ω)=Ft(ω′);
-
-
information filtration F = { F t } t ∈ T \mathcal{F}=\{\mathcal{F_t}\}_{t\in T} F={Ft}t∈T 是单调递增的。
单调递增就是说, t t t 时刻对 Ω \Omega Ω 的划分是 t + 1 t+1 t+1 时刻对 Ω \Omega Ω 的划分的子划分;
- t t t 时刻的划分就像是在 t + 1 t+1 t+1 时刻的划分的基础上再进行划分;
- t + 1 t+1 t+1 时刻的划分就好像在 t t t 时刻的划分的基础上进行合并。
例:考虑一个简单的硬币投掷实验时,用这个例子来说明这些概念。
假设我们有一个正面朝上的硬币和一个反面朝上的硬币。我们将状态空间 Ω \Omega Ω 定义为这两个硬币的可能组合: Ω = { 正面硬币 , 反面硬币 } \Omega = \{\text{正面硬币}, \text{反面硬币}\} Ω={正面硬币,反面硬币}。
现在,让我们考虑某个特定的时刻 t t t,并定义可观测事件集合 F t \mathcal{F}_t Ft。在这个例子中,我们假设在时刻 t t t 我们可以观察到的事件有:
- A 1 A_1 A1: 正面硬币朝上
- A 2 A_2 A2: 反面硬币朝上
因此,我们有 F t = { ∅ , A 1 , A 2 , A 1 c , A 2 c , Ω } \mathcal{F}_t = \{\varnothing, A_1, A_2, A_1^c, A_2^c, \Omega\} Ft={∅,A1,A2,A1c,A2c,Ω}
现在,我们可以考虑特定状态下的可观测事件集合 F t ( ω ) \mathcal{F}_t(\omega) Ft(ω)。对于每个状态 ω ∈ Ω \omega \in \Omega ω∈Ω,我们可以确定在该状态下观察到的事件。
- 当 ω = 正面硬币 \omega = \text{正面硬币} ω=正面硬币 时, F t ( 正面硬币 ) = { A 1 } \mathcal{F}_t(\text{正面硬币}) = \{A_1\} Ft(正面硬币)={A1}。在这种情况下,我们只能观察到正面硬币朝上的事件 A 1 A_1 A1。
- 当 ω = 反面硬币 \omega = \text{反面硬币} ω=反面硬币 时, F t ( 反面硬币 ) = { A 2 } \mathcal{F}_t(\text{反面硬币}) = \{A_2\} Ft(反面硬币)={A2}。在这种情况下,我们只能观察到反面硬币朝上的事件 A 2 A_2 A2。
在这个例子中,所有的 F t ( ω ) \mathcal{F}_t(\omega) Ft(ω) 构成了 Ω \Omega Ω 的一个划分。其中, F t ( 正面硬币 ) \mathcal{F}_t(\text{正面硬币}) Ft(正面硬币) 和 F t ( 反面硬币 ) \mathcal{F}_t(\text{反面硬币}) Ft(反面硬币) 是互斥的,它们的并集等于 Ω \Omega Ω。
概率测度
概率测度 P : F → [ 0 , 1 ] \mathbb{P}:\,\mathcal{F}\to[0,\,1] P:F→[0,1] 是一个函数,满足以下性质:
- P ( Ω ) = 1 \mathbb{P}(\Omega)=1 P(Ω)=1 ;
- 对于 ∀ A ∈ F \forall A\in\mathcal{F} ∀A∈F ,有 P ( A c ) = 1 − P ( A ) \mathbb{P}(A^c)=1-\mathbb{P}(A) P(Ac)=1−P(A) ;
- 对于不相交的事件 { A n } n = 1 ∞ ⊂ F t \{A_n\}_{n=1}^{\infty}\subset\mathcal{F}_t {An}n=1∞⊂Ft ,有 P ( { A n } n = 1 ∞ ) = ∑ n = 1 ∞ P ( A n ) \mathbb{P}(\{A_n\}_{n=1}^{\infty})=\sum\limits_{n=1}^{\infty}\mathbb{P}(A_n) P({An}n=1∞)=n=1∑∞P(An) 。
随机变量 Random Variable
定义在概率空间 ( Ω , F , P ) (\Omega,\,\mathcal{F},\,\mathbb{P}) (Ω,F,P) 上的随机变量 X X X 是一个函数 X : Ω → X X:\,\Omega\to\mathbb{X} X:Ω→X ,其中集合 X \mathbb{X} X 定义在测度空间 ( X , B ( X ) ) (\mathbb{X},\,\mathcal{B}(\mathbb{X})) (X,B(X)) 上;
测度空间 ( X , B ( X ) ) (\mathbb{X},\mathcal{B}(\mathbb{X})) (X,B(X)) 是由一个集合 X \mathbb{X} X 和一个 σ-代数 B ( X ) \mathcal{B}(\mathbb{X}) B(X) 组成的结构。
- 集合 X \mathbb{X} X 是一个非空集合,它包含了我们感兴趣的元素或对象。
- σ-代数 B ( X ) \mathcal{B}(\mathbb{X}) B(X) 是 X \mathbb{X} X 上的一个 σ-代数,它是由 X \mathbb{X} X 的子集构成的集合,满足一些特定的性质。
我们之后只考虑 X \mathbb{X} X 为欧几里得空间, B ( X ) \mathcal{B}(\mathbb{X}) B(X) 是包含该空间中所有开集的最小 σ-代数。
分布 CDF and PDF
CDF:(累积)分布函数,定义为:
F
X
(
x
)
=
P
(
{
ω
:
X
(
ω
<
x
}
)
,
∀
x
∈
X
F_X(x)=\mathbb{P}(\{\omega:\,X(\omega<x\}),\quad\forall x\in\mathbb{X}
FX(x)=P({ω:X(ω<x}),∀x∈X
PDF:概率密度函数,若存在,则定义为:
P
(
x
∈
X
)
=
∫
X
f
(
x
)
d
x
\mathbb{P}(x\in X)=\int_Xf(x)\,dx
P(x∈X)=∫Xf(x)dx
例:
n
n
n 维的服从正态分布随机向量,其概率密度函数为:
f
(
x
)
=
1
(
2
π
)
n
2
∣
Σ
∣
1
2
e
x
p
{
−
1
2
(
x
−
μ
)
T
Σ
−
1
(
x
−
μ
)
}
f(x)= \frac{1}{(2\pi)^\frac{n}{2}|\Sigma|^\frac{1}{2}} \mathrm{exp}\left\{ -\frac{1}{2}(x-\mu)^T\Sigma^{-1}(x-\mu) \right\}
f(x)=(2π)2n∣Σ∣211exp{−21(x−μ)TΣ−1(x−μ)}
其中
μ
\mu
μ 是
n
×
1
n\times 1
n×1 的向量,
Σ
\Sigma
Σ 是
n
×
n
n\times n
n×n 的正定矩阵。
例:如果
X
X
X 是取值为
{
x
1
,
x
2
,
⋯
,
x
n
}
\{x_1,\,x_2,\,\cdots,\,x_n\}
{x1,x2,⋯,xn} 的离散随机变量,则其 CDF
F
(
⋅
)
F(\cdot)
F(⋅) 是一个阶梯函数,其概率密度函数为:
f
(
x
)
=
∑
i
=
1
n
p
i
δ
(
x
−
x
i
)
f(x)=\sum\limits_{i=1}^{n}p_i\delta(x-x_i)
f(x)=i=1∑npiδ(x−xi)
其中
p
i
=
P
(
X
=
x
i
)
p_i=P(X=x_i)
pi=P(X=xi) ,
δ
(
x
)
\delta(x)
δ(x) 是 Dirac 函数。
Dirac函数(Dirac delta函数)是一种常用的广义函数,也被称为狄拉克 δ \delta δ 函数或单位脉冲函数。在其他处为 0,在 0 处无穷大,但是积分为 1。Dirac函数具有以下性质:
- 归一性: ∫ δ ( x ) d x \int\delta(x)\,dx ∫δ(x)dx,表示在整个实数轴上对 Dirac 函数进行积分的结果是1;
- 零除一性:对于任意实数 a ≠ 0, ∫ δ ( a x ) d t = 1 ∣ a ∣ \int\delta(ax)\,dt=\frac{1}{|a|} ∫δ(ax)dt=∣a∣1 ;
- 零除性:对于任意实数 a ≠ 0 a\not=0 a=0 , ∫ f ( x ) δ ( a x ) d t = f ( 0 ) ∣ a ∣ \int f(x)\delta(ax)\,dt=\frac{f(0)}{|a|} ∫f(x)δ(ax)dt=∣a∣f(0) ;
- 位移性: ∫ δ ( x − x 0 ) d x = 1 \int\delta(x-x_0)\,dx=1 ∫δ(x−x0)dx=1 ;
δ
(
x
)
\delta(x)
δ(x) 满足以下性质,对于
X
\mathbb{X}
X 上的任何连续函数
g
g
g ,都有:
∫
X
g
(
x
)
δ
(
x
−
y
)
d
x
=
g
(
y
)
,
y
∈
X
\int_Xg(x)\delta(x-y)dx=g(y),\quad y\in X
∫Xg(x)δ(x−y)dx=g(y),y∈X
证明:可以把
δ
(
x
)
\delta(x)
δ(x) 看作是在
[
0
,
1
n
]
[0,\,\frac{1}{n}]
[0,n1] 上取值为
n
n
n ,其余处取值为
0
0
0 的方形脉冲函数,且
n
→
∞
n\to\infty
n→∞ 。则:
∫
X
g
(
x
)
δ
n
(
x
−
y
)
d
x
=
n
∫
y
y
+
1
n
g
(
x
)
d
x
=
g
(
y
)
\int_Xg(x)\delta_n(x-y)\,dx=n\int_y^{y+\frac{1}{n}}g(x)\,dx=g(y)
∫Xg(x)δn(x−y)dx=n∫yy+n1g(x)dx=g(y)
期望和条件期望 Expectation and conditional expectation
期望:
- 简单随机变量 X X X 的期望定义为:
E P [ X ] = ∑ i = 1 ∞ P ( X = x i ) \mathbb{E_P}[X]=\sum\limits_{i=1}^{\infty}\mathbb{P}(X=x_i) EP[X]=i=1∑∞P(X=xi)
- 对于简单非负随机变量 X X X ,其期望还可以写成:
E P [ X ] = sup Y ∈ X 0 s.t. Y ≤ X E P [ Y ] \mathbb{E_P}[X]=\sup_{Y\in \mathbb{X_0}\,\,\text{s.t.}\,\,Y \leq X}\mathbb{E_P}[Y] EP[X]=Y∈X0s.t.Y≤XsupEP[Y]
其中 X 0 ⊆ X \mathbb{X_0}\subseteq \mathbb{X} X0⊆X 是 X X X 的取值范围
- 对于任意随机变量,其期望都可以表示成:
E P [ X ] = E P [ X + ] − E P [ X − ] \mathbb{E_P}[X]=\mathbb{E_P}[X^+]-\mathbb{E_P}[X^-] EP[X]=EP[X+]−EP[X−]
其中 X + = max { X , 0 } X^+=\max\{X,\,0\} X+=max{X,0} , X − = min { X , 0 } X^-=\min\{X,\,0\} X−=min{X,0} ;
- 在事件 A ∈ F A\in \mathcal{F} A∈F 条件之下的 X X X 的条件期望为:
E P [ X ∣ A ] = E P ( ⋅ ∣ A ) [ X ] \mathbb{E_P}[X\,|\,A]=\mathbb{E}_{\mathbb{P}(\cdot\,|\,A)}[X] EP[X∣A]=EP(⋅∣A)[X]
期望的性质:
- 对于 ∀ X \forall X ∀X , ∣ E P [ X ] ∣ ≤ E P [ ∣ X ∣ ] |\mathbb{E_P}[X]|\leq\mathbb{E_P}[|X|] ∣EP[X]∣≤EP[∣X∣] ;
- 对于任意 concave function f : X → R f:\,\mathbb{X}\to\mathbb{R} f:X→R ,根据琴生不等式(Jensen’s inequality),有:
E P [ f ( X ) ] ≤ f ( E P [ X ] ) \mathbb{E_P}\left[f(X)\right]\leq f(\mathbb{E_P}[X]) EP[f(X)]≤f(EP[X])
- 令 G \mathcal{G} G 和 H \mathcal{H} H 为 F \mathcal{F} F 的 σ \sigma σ-子代数,若 G ⊂ H \mathcal{G}\subset\mathcal{H} G⊂H ,则有:
E P [ E P [ X ∣ H ] ∣ G ] = E P [ X ∣ G ] \mathbb{E_P}[\mathbb{E_P}[X\,|\,\mathcal{H}]\,|\,\mathcal{G}]=\mathbb{E_P}[X\,|\,\mathcal{G}] EP[EP[X∣H]∣G]=EP[X∣G]
- 件期望 E P ( X ∣ Y ) \mathbb{E_P}(X|Y) EP(X∣Y) 是关于随机变量 Y Y Y 生成的 σ \sigma σ-代数 F Y \mathcal{F}^Y FY 可测的,而且可以用 B ( X ) \mathcal{B}(\mathbb{X}) B(X) 下可测量的 Y Y Y 的函数 f ( ⋅ ) f(\cdot) f(⋅) 来表示,有:
E P [ X ∣ Y ] = f ( Y ) \mathbb{E_P}[X\,|\,Y]=f(Y) EP[X∣Y]=f(Y)
独立性 Independence
独立性:随机变量
X
X
X 和
Y
Y
Y 是相互独立的,当对任意
X
0
\mathbb{X_0}
X0 ,
Y
0
∈
B
(
X
)
\mathbb{Y_0} \in \mathcal{B}(\mathbb{X})
Y0∈B(X) ,有:
P
(
X
∈
X
0
,
Y
∈
Y
0
)
=
P
(
X
∈
X
0
)
P
(
Y
∈
Y
0
)
\mathbb{P}(X\in \mathbb{X_0},\,Y\in\mathbb{Y_0})=\mathbb{P}(X\in \mathbb{X_0})\mathbb{P}(Y\in\mathbb{Y_0})
P(X∈X0,Y∈Y0)=P(X∈X0)P(Y∈Y0)
性质:若
X
X
X 和
Y
Y
Y 相互独立,则:
- E P [ X ∣ Y ] = E P [ X ] \mathbb{E_P}[X\,|\,Y]=\mathbb{E_P}[X] EP[X∣Y]=EP[X] ;
- E P [ X Y ] = E P ( X ) E P ( Y ) \mathbb{E_P}[XY]=\mathbb{E_P}(X)\mathbb{E_P}(Y) EP[XY]=EP(X)EP(Y) ,即 C o v ( X , Y ) = 0 \mathrm{Cov}(X,\,Y)=0 Cov(X,Y)=0 ;
- 令 f ( x ) f(x) f(x) 和 g ( y ) g(y) g(y) 分别为 X X X 和 Y Y Y 的概率密度函数, h ( x , y ) h(x,\,y) h(x,y) 为 ( X , Y ) (X,\,Y) (X,Y) 的联合概率密度函数,则:
X and Y are independent ⟺ h ( x , y ) = f ( x ) g ( y ) X\text{ and }Y\text{are independent} \iff h(x,\,y)=f(x)g(y) X and Yare independent⟺h(x,y)=f(x)g(y)
特征方程 Characteristic Functions
特征方程:对于定义在
R
m
\mathbb{R}^m
Rm 上的随机变量
X
X
X ,其特征方程
Θ
:
Z
m
→
Z
\Theta:\,\mathcal{Z}^m\to\mathcal{Z}
Θ:Zm→Z 是其概率密度函数
f
(
⋅
)
f(\cdot)
f(⋅) 的 Laplace 变换,即:
Θ
(
s
)
=
L
{
f
(
x
)
}
(
s
)
=
∫
e
−
s
x
f
(
x
)
d
t
\Theta(s)=\mathcal{L}\{f(x)\}(s)=\int\mathrm{e}^{-sx}f(x)\,dt
Θ(s)=L{f(x)}(s)=∫e−sxf(x)dt
- 虽然是 Laplace 变换,但是特征方程往往不是定义在整个复平面上的,而是 Z m \mathcal{Z}^m Zm 上的一个条状区域;
- 我们也可以用 Laplace 逆变换来从特征方程得到概率密度函数,对于一维的随机变量,有:
f ( x ) = 1 2 π j ∫ δ − j ∞ δ + j ∞ Θ ( s ) e s x d s = L − 1 { Θ ( s ) } ( x ) f(x) =\frac{1}{2\pi j}\int_{\delta-j\infty}^{\delta+j\infty}\Theta(s)\mathrm{e}^{sx}\,ds =\mathcal{L}^{-1}\left\{ \Theta(s) \right\}(x) f(x)=2πj1∫δ−j∞δ+j∞Θ(s)esxds=L−1{Θ(s)}(x)
其中 j j j 是虚数单位;
给定一个函数 f ( t ) f(t) f(t),其中 t t t 表示时间,它的 Laplace 变换定义为:
F ( s ) = L { f ( t ) } = ∫ 0 ∞ e − s t f ( t ) d t F(s)=\mathcal{L}\{f(t)\}=\int_0^{\infty}\mathrm{e}^{-st}f(t)\,dt F(s)=L{f(t)}=∫0∞e−stf(t)dt
给定一个函数 F ( s ) F(s) F(s),它的逆 Laplace 变换 f ( t ) f(t) f(t) 定义为:
f ( t ) = L − 1 { F ( s ) } = 1 2 π i lim T → ∞ ∫ γ − i T γ + i T e s t F ( s ) d s f(t)=\mathcal{L}^{-1}\left\{ F(s) \right\}=\frac{1}{2\pi i}\lim\limits_{T\to\infty}\int_{\gamma-iT}^{\gamma+iT}\mathrm{e}^{st}F(s)\,ds f(t)=L−1{F(s)}=2πi1T→∞lim∫γ−iTγ+iTestF(s)ds
范数空间 Norm Space
向量空间:集合 S S S 构成向量空间,若:
- ∅ ∈ S \varnothing \in S ∅∈S ;
- X , Y ∈ S X,\,Y\in S X,Y∈S ⇒ \Rightarrow ⇒ X + Y ∈ S X+Y\in S X+Y∈S ;
- α ∈ R \alpha\in\mathbb{R} α∈R , X ∈ S X\in S X∈S ⇒ \Rightarrow ⇒ α X ∈ S \alpha X\in S αX∈S ;
范数空间:或称为范数向量空间 S S S ,是在向量空间的基础上定义 范数 ∣ ∣ X ∣ ∣ ||X|| ∣∣X∣∣, X ∈ S X\in S X∈S ,满足:
- ∣ ∣ X ∣ ∣ ≥ 0 ||X|| \geq 0 ∣∣X∣∣≥0 ,且 ∣ ∣ X ∣ ∣ = 0 ⟺ X = ∅ ||X||=0 \iff X=\varnothing ∣∣X∣∣=0⟺X=∅ ;
- ∣ ∣ α X ∣ ∣ = ∣ α ∣ ∣ ∣ X ∣ ∣ ||\alpha X||=|\alpha|||X|| ∣∣αX∣∣=∣α∣∣∣X∣∣ ;
- ∣ ∣ X + Y ∣ ∣ ≤ ∣ ∣ X ∣ ∣ + ∣ ∣ Y ∣ ∣ ||X+Y||\leq ||X||+||Y|| ∣∣X+Y∣∣≤∣∣X∣∣+∣∣Y∣∣ ;
L p \mathcal{L}^p Lp 范数:对于 1 ≤ p ≤ ∞ 1 \leq p \leq \infty 1≤p≤∞ ,随机变量 X X X 若满足 E P [ ∣ X ∣ p ∣ F ] < ∞ \mathbb{E_P}[|X|^p\,|\,\mathcal{F}]\lt \infty EP[∣X∣p∣F]<∞ ,则称 X X X 是 p p p 阶可积的,或 L p \mathcal{L}^p Lp-可积的。
这个条件表示在给定 F \mathcal{F} F 的情况下, X X X 的绝对值的 p p p 次幂的条件期望存在且有界。也就是说, X X X 的 p p p 次幂在给定 F \mathcal{F} F 的信息下具有有限的平均值。
所有定义在
X
\mathbb{X}
X 上的
L
p
\mathcal{L}^p
Lp-可积的随机变量构成了范数空间
L
p
\mathcal{L}^p
Lp-范数:
∣
∣
X
∣
∣
L
p
(
Ω
,
F
,
P
)
≡
(
E
P
[
∣
X
∣
p
∣
F
]
)
1
p
||X||_{\mathcal{L}^p}(\Omega,\,\mathcal{F},\,\mathbb{P})\equiv (\mathbb{E_P}[|X|^p\,|\,\mathcal{F}])^{\frac{1}{p}}
∣∣X∣∣Lp(Ω,F,P)≡(EP[∣X∣p∣F])p1
线性函数:定义在范数空间
(
V
,
∣
∣
⋅
∣
∣
V
)
(\mathbb{V},\,||\cdot||_{\mathbb{V}})
(V,∣∣⋅∣∣V) 上的线性函数
f
:
V
→
R
f:\,\mathbb{V}\to\mathbb{R}
f:V→R 满足:
f
(
α
X
+
β
y
)
=
α
f
(
X
)
+
β
f
(
Y
)
,
∀
X
,
Y
∈
V
,
α
,
β
∈
R
f(\alpha X+\beta y)=\alpha f(X)+\beta f(Y),\quad \forall X,\,Y\in\mathbb{V},\,\,\alpha,\,\beta\in\mathbb{R}
f(αX+βy)=αf(X)+βf(Y),∀X,Y∈V,α,β∈R
注意:线性函数
f
f
f 是有界的,若存在一个正常数
M
M
M 使得:
∣
f
(
X
)
∣
≤
M
∣
∣
X
∣
∣
V
,
∀
x
∈
V
|f(X)|\leq M||X||_{\mathbb{V}},\quad \forall x\in\mathbb{V}
∣f(X)∣≤M∣∣X∣∣V,∀x∈V
Th 1:对于
∀
p
,
q
≥
1
\forall p,\,q\geq 1
∀p,q≥1 满足
1
p
+
1
q
=
1
\frac{1}{p}+\frac{1}{q}=1
p1+q1=1 ,
X
∈
L
p
(
Ω
,
F
,
P
)
X\in {\mathcal{L}^p}(\Omega,\,\mathcal{F},\,\mathbb{P})
X∈Lp(Ω,F,P) ,
Y
∈
L
q
(
Ω
,
F
,
P
)
Y\in {\mathcal{L}^q}(\Omega,\,\mathcal{F},\,\mathbb{P})
Y∈Lq(Ω,F,P) ,可以推出:
X
∙
Y
≡
X
T
Y
∈
L
1
(
Ω
,
F
,
P
)
X\bullet Y\equiv X^TY\in {\mathcal{L}^1}(\Omega,\,\mathcal{F},\,\mathbb{P})
X∙Y≡XTY∈L1(Ω,F,P)
特别地:
∣
∣
X
∙
Y
∣
∣
L
1
≤
∣
∣
X
∣
∣
L
p
∣
∣
Y
∣
∣
L
q
||X\bullet Y||_{\mathcal{L}^1} \leq ||X||_{\mathcal{L}^p}||Y||_{\mathcal{L}^q}
∣∣X∙Y∣∣L1≤∣∣X∣∣Lp∣∣Y∣∣Lq
推广下去,可以得到:
L
1
(
Ω
,
F
,
P
)
⊃
L
2
(
Ω
,
F
,
P
)
⊃
⋯
⊃
L
∞
(
Ω
,
F
,
P
)
{\mathcal{L}^1}(\Omega,\,\mathcal{F},\,\mathbb{P}) \supset{\mathcal{L}^2}(\Omega,\,\mathcal{F},\,\mathbb{P}) \supset\cdots \supset{\mathcal{L}^\infty}(\Omega,\,\mathcal{F},\,\mathbb{P})
L1(Ω,F,P)⊃L2(Ω,F,P)⊃⋯⊃L∞(Ω,F,P)
Th 2:令
Φ
\Phi
Φ 是范数空间
(
V
,
∣
∣
⋅
∣
∣
V
)
(\mathbb{V},\,||\cdot||_{\mathbb{V}})
(V,∣∣⋅∣∣V) 上的线性函数,则
Φ
\Phi
Φ 是连续的当且仅当它是有界的。特别地,只要
Φ
\Phi
Φ 在
X
=
0
X=0
X=0 处连续,就有
Φ
\Phi
Φ 在
V
\mathbb{V}
V 上处处连续。
Rietz Representation Theorem:令 f f f 是 L p ( Ω , F , P ) {\mathcal{L}^p}(\Omega,\,\mathcal{F},\,\mathbb{P}) Lp(Ω,F,P) 上的线性函数,并且 p ≠ ∞ p\not=\infty p=∞ . 则 f f f 是连续的当且仅当存在一个唯一的 ζ ∈ L q ( Ω , F , P ) \zeta\in{\mathcal{L}^q}(\Omega,\,\mathcal{F},\,\mathbb{P}) ζ∈Lq(Ω,F,P) ,且 1 p + 1 q = 1 \frac{1}{p}+\frac{1}{q}=1 p1+q1=1 ,使得对于 ∀ X ∈ L p \forall X\in \mathcal{L}^p ∀X∈Lp ,都有 f ( X ) = E P ( ζ X ) f(X)=\mathbb{E_P}(\zeta X) f(X)=EP(ζX) ;
Hahn-Banach Theorem:令 V \mathbb{V} V 是一个范数空间, A A A 和 B B B 是其两个凸子集。当下面两个条件之一满足,且 A A A 不包含 B B B 的内部点,则:存在一个 V \mathbb{V} V 上的非零连续线性函数 f f f 和一个常数 c c c 使得对于 ∀ X ∈ A \forall X\in A ∀X∈A , ∀ Y ∈ B \forall Y\in B ∀Y∈B ,有 f ( X ) ≥ c ≥ f ( Y ) f(X)\geq c \geq f(Y) f(X)≥c≥f(Y) :
- V \mathbb{V} V 是有限维的范数空间;
- V \mathbb{V} V 是无限维时, B B B 中至少有一个内部点;
(这个有点像凸集分离定理)
收敛性 Convergence
定义:给定一系列取值在 X \mathbb{X} X 上、定义在概率空间 ( Ω , F , P ) (\Omega,\,\mathcal{F},\,\mathbb{P}) (Ω,F,P) 的随机变量序列 { X n } \{X_n\} {Xn} ,有以下收敛性:
- 几乎必然收敛: X n → X X_n\to X Xn→X , P − a.s. \mathbb{P}-\text{a.s.} P−a.s. ,若:
P ( { ω : X n ( ω ) → X ( ω ) } ) = 1 , ∀ ω ∈ Ω \mathbb{P}(\{\omega:\,X_n(\omega)\to X(\omega)\})=1,\quad \forall \omega\in\Omega P({ω:Xn(ω)→X(ω)})=1,∀ω∈Ω
- 依概率收敛: P - lim n → ∞ X n = X \mathbb{P}\text{-}\lim_{n\to\infty}X_n=X P-limn→∞Xn=X ,或 X n → X X_n\to X Xn→X in probability,若:
P ( { ω : ∣ X n ( ω ) − X ( ω ) ∣ > ε } ) → 0 , ∀ ε > 0 , ∀ ω ∈ Ω \mathbb{P}(\{\omega:\,|X_n(\omega)-X(\omega)|> \varepsilon\})\to 0,\quad \forall \varepsilon > 0,\,\forall \omega\in\Omega P({ω:∣Xn(ω)−X(ω)∣>ε})→0,∀ε>0,∀ω∈Ω
- 弱收敛: X n → w X X_n\xrightarrow{\text{w}}X XnwX ,或 X n → X X_n\to X Xn→X weakly,若:
E [ f ( X n ) ] → E [ f ( X ) ] , ∀ f ∈ C B ( X ) \mathbb{E}[f(X_n)]\to\mathbb{E}[f(X)],\quad \forall f\in C_B(\mathbb{X}) E[f(Xn)]→E[f(X)],∀f∈CB(X)
C B ( X ) C_B(\mathbb{X}) CB(X) 表示有界连续函数类(bounded continuous functions)
- 依分布收敛: X n → dist X X_n\xrightarrow{\text{dist}}X XndistX ,或 X n → X X_n\to X Xn→X in distribution,若:
F n ( X ) → F ( X ) , ∀ X ∈ X F_n(X)\to F(X),\quad\forall X\in\mathbb{X} Fn(X)→F(X),∀X∈X
- 依范数收敛: X n → L p X X_n\xrightarrow{\mathcal{L}^p}X XnLpX ( p ≥ 1 p\geq 1 p≥1),或 X n → X X_n\to X Xn→X in L p \mathcal{L}^p Lp-norm,若:
∣ ∣ X n − X ∣ ∣ L p → 0 ||X_n-X||_{\mathcal{L}^p}\to 0 ∣∣Xn−X∣∣Lp→0
Proposition 1:
X
n
→
X
,
P
-a.s.
⇒
P
-
lim
n
→
∞
X
n
=
X
⇒
X
n
→
w
X
⟺
X
n
→
dist
X
X_n\to X,\,\mathbb{P}\text{-a.s.} \Rightarrow \mathbb{P}\text{-}\lim_{n\to\infty}X_n=X \Rightarrow X_n\xrightarrow{\text{w}}X \iff X_n\xrightarrow{\text{dist}}X
Xn→X,P-a.s.⇒P-n→∞limXn=X⇒XnwX⟺XndistX
Proposition 2:
X
n
→
L
p
X
⇒
P
-
lim
n
→
∞
X
n
=
X
X_n\xrightarrow{\mathcal{L}^p}X \Rightarrow \mathbb{P}\text{-}\lim_{n\to\infty}X_n=X
XnLpX⇒P-n→∞limXn=X
Proposition 3:令
X
n
→
dist
X
X_n\xrightarrow{\text{dist}}X
XndistX 的特征函数为
{
Θ
(
⋅
)
}
n
=
1
∞
\{\Theta(\cdot)\}_{n=1}^{\infty}
{Θ(⋅)}n=1∞ ,则:
lim
n
→
∞
Θ
n
(
s
)
=
Θ
∞
(
s
)
,
R
e
(
s
)
=
0
\lim\limits_{n\to\infty}\Theta_n(s)=\Theta_{\infty}(s),\quad\mathrm{Re}(s)=0
n→∞limΘn(s)=Θ∞(s),Re(s)=0
相反地,若
lim
n
→
∞
Θ
n
(
s
)
=
Θ
∞
(
s
)
\lim\limits_{n\to\infty}\Theta_n(s)=\Theta_{\infty}(s)
n→∞limΘn(s)=Θ∞(s) 是 well defined,且
Θ
(
s
)
\Theta(s)
Θ(s) 沿虚轴
R
e
(
s
)
=
0
\mathrm{Re}(s)=0
Re(s)=0 连续,则存在某个特征函数为
Θ
(
s
)
\Theta(s)
Θ(s) 的随机变量
X
X
X ,使得
X
n
→
dist
X
X_n\xrightarrow{\text{dist}}X
XndistX 。
R e ( s ) = 0 \mathrm{Re}(s)=0 Re(s)=0 表示 s s s 的实部为零
(命题 3 的两种情况并不是当且仅当的关系,反过来推的时候要求 Θ ( s ) \Theta(s) Θ(s) 是个连续函数)文章来源:https://www.toymoban.com/news/detail-457973.html
Monotone Convergence Theorem:若
0
≤
X
1
≤
⋯
≤
X
n
≤
⋯
0\leq X_1 \leq \cdots \leq X_n \leq \cdots
0≤X1≤⋯≤Xn≤⋯ ,则:
X
n
→
X
,
P
-a.s.
⇒
E
[
X
n
]
→
E
[
X
]
X_n\to X,\,\mathbb{P}\text{-a.s.} \Rightarrow \mathbb{E}[X_n]\to\mathbb{E}[X]
Xn→X,P-a.s.⇒E[Xn]→E[X]
Fatou’s Lemma:若
X
n
≥
X
X_n \geq X
Xn≥X 且
E
[
X
+
]
<
+
∞
\mathbb{E}[X^+]\lt +\infty
E[X+]<+∞ ,则:
E
[
lim inf
n
→
∞
X
n
]
≤
lim inf
n
→
∞
E
[
X
n
]
\mathbb{E}[\liminf _{n\to\infty}X_n] \leq \liminf_{n\to\infty}\mathbb{E}[X_n]
E[n→∞liminfXn]≤n→∞liminfE[Xn]
Dominated Convergence Theorem:若
P
-
lim
n
→
∞
X
n
=
X
\mathbb{P}\text{-}\lim_{n\to\infty}X_n=X
P-limn→∞Xn=X 且
∣
X
n
∣
≤
Y
∈
L
1
|X_n|\leq Y\in \mathcal{L}^1
∣Xn∣≤Y∈L1 ,则:文章来源地址https://www.toymoban.com/news/detail-457973.html
- X ∈ L 1 X\in \mathcal{L}^1 X∈L1 ;
- E [ X n ] → E [ X ] \mathbb{E}[X_n]\to\mathbb{E}[X] E[Xn]→E[X] ;
- X n → L 1 X X_n\xrightarrow{\mathcal{L}^1}X XnL1X ;
到了这里,关于量化投资 离散时间随机过程的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!