由于一些必然中的偶然原因,最近知乎推荐给我了不少有关相对论的问题,特别是狭义相对论时空观相关的问题,这使我想起了我自己最早接触到狭义相对论及其结论的时候那种心灵的震撼感。“钟慢效应”、“尺缩效应”、“光速不变”、“质能关系”,这些当时都冲击着我的时空观甚至世界观。相对论是在物理学研究到了一定深度后,爱因斯坦基于他那种对“理论的对称和美”的执着信仰以及天才的思想,为当时物理学构建的一个美妙的数学模型。之后无数的物理学实验都一次又一次的验证着这个数学模型的精准、所蕴含思想的深刻以及对人类经典时空观的颠覆!
当然,对时空观认知的颠覆是不容易让人很快理解的,当时能懂得相对论的人是非常少的。不过在100多年后的今天,狭义相对论的基本内容早已经进入了大学物理教材,许多物理爱好者也都愿意学习、研究狭义相对论。我想,随着社会教育水平、人们基础科学知识水平和科学精神的提升,狭义相对论的时空观迟早有一天会成为社会的普遍基础认知。
但是,截至目前,对狭义相对论的理解还只是专业、半专业人士的事儿,社会大众对此的认知更多的遭到了错误的诱导,甚至有人提出这样的问题“相对论为什么不堪一击?”。我写这篇文章就是希望能为大家认识理解我们这个世界的真实时空、为相对论时空观的普及尽一点绵薄之力。同时,狭义相对论的诞生过程,也是一个极为优美的数学和逻辑推理过程,我这篇文章不像大多数相对论科普文章那样通过似是而非的例子来传播相对论思想,而是基于对物理事实的基本认知,通过相对严格的数学逻辑推导,告诉大家这个伟大的数学建模过程是怎样的,人类的理性思考是如何推动科学进步的。
狭义相对论与其说是一个物理学理论,莫如说是一个针对物理的数学模型。但是大家不要一听到数学模型,就感觉它一定有着大量的近似、大量的假设,很不精确。恰恰相反,狭义相对论的基础假设很少,其结论又极为精确。因此,狭义相对论是一个极为精准、极为优美的数学模型!到今天为止,只要具备基本理性思维的人,无论是否乐意,都不得不承认狭义相对论及其结论在我们能够认知到的精度内是完全正确的。所以,我们愿意也好、不愿意也罢,都不得不说狭义相对论就是在平直时空下的客观世界规律(至于非平直的时空,就交给广义相对论去处理吧)。注意我在这句话中用到的谓词是“是”,我曾经在回答一个问题的时候说过“我相信相对论的程度要比西方最虔诚的基督教徒相信上帝的程度还要高”。
那么狭义相对论的基础假设是什么呢?一共就两个:光速不变原理+相对性原理。让我们来逐一介绍并解释一下。
一、为什么光速不变?
“光速不变”说的是光的速度不随参照系的变化而发生变化,在任何参照系中看来,光的速度都是一样的。
说到光,这个物质的的确确是帮助我们认识世界的非常重要的突破口!关于什么是光的本质,人们争论了几百年之久,直到今天被认可的“波粒二象性”,仍然有人提出各种质疑。这里我们不去讨论对光的各种复杂认知,但是必须要指出的是,伟大的麦克斯韦通过其基于电磁学各种实验结论而得到的“麦克斯韦方程组”告诉我们,这个世界上存在一种因电场和磁场交互震荡而形成的波动——“电磁波”,其在真空中的速度大小为 1 ε 0 ⋅ μ 0 \frac{1}{\sqrt{\varepsilon_0\cdot \mu_0}} ε0⋅μ01 ,这里面 ε 0 \varepsilon_0 ε0 是真空介电常数, μ 0 \mu_0 μ0 是真空磁导率。这两个量都是物理常数,不会随着参照系的变化而变化,那么电磁波在真空中的速度当然也就与参照系无关了,除非“麦克斯韦方程组”仅仅适用于某个特定的参照系。
由于计算出来的“电磁波”速度恰好等于测量得到的真空中光速,麦克斯韦断定光就是一种电磁波。今天,人们对“光是电磁波”这个结论毫无争议。我之后提到“光”指的就是“电磁波”。
现在我们面临着两个选择,一个是认为麦克斯韦方程组仅仅适用于某个特定的参照系,只是在这个参照系中,光速才等于 1 ε 0 ⋅ μ 0 \frac{1}{\sqrt{\varepsilon_0\cdot \mu_0}} ε0⋅μ01,其它参照系中的光速需要按照经典物理学的速度合成公式计算得到;第二个选择是认为麦克斯韦方程组适用于不同的参照系,从而在这些参照系中光速都是不变的,哪怕这些参照系相互之间在相对运动。
这两个选择的第一个抛弃了“相对性原理”,而第二个则抛弃了“经典时空观”。猜猜当时在二十世纪初的几乎全部的物理学家是如何选择的呢?毫无悬念,大家都选择了第一个选项,因为大家都觉得时空观是不可能有问题的。到今天为止,我们世界上生活着的99.9%的人仍然持有“绝对时空观”,也就是时间和空间是绝对的,是不会随着参照系的变化而变化的。99.9%的人都会认为,在一个参照系中1米长的尺子,不去干扰它,在另外一个参照系中它的长度必然还是1米;在一个参照系中看来某个人生活了1年,在另外一个参照系中看去,他必然还是生活了1年。
既然选择了选项一,那么就是说麦克斯韦方程组仅仅适用于某个特定的参照系。显然,我们得到麦克斯韦方程组这个研究结论是基于我们大量的电磁学实验(法拉第为此做出了巨大贡献,应该在这里提一下他老人家的名字),而这些电磁学实验都是在地面上做的,那么地面这个参照系是否就是麦克斯韦方程组适用的那个参照系呢?接近,但还不是。当时的物理学家已经认识到,太阳系是一个更为良好的“惯性参照系”,地球因为自传及绕太阳公转,很多时候需要引入非惯性力(如科里奥力)来“适配”物理学理论。
既然太阳系是一个良好的“惯性系”,使得包括麦克斯韦方程组在内的物理学理论都适用,那么因为地球绕着太阳旋转,我们就应该能够通过有关光的物理学实验,发现地球上存在着不符合麦克斯韦方程组的情况。起码来说,因为地球自转并绕太阳旋转,那么顺着转动方向的光和逆着转动方向的光的速度在地面上看来应该是不同的。两个著名的物理学家迈克尔逊和莫雷做了一个非常巧妙的实验,利用光的干涉来检验这两个不同的速度,得到的结果却和预料的完全相反,干涉条纹没有任何移动,意味着两个方向的光速没有区别!
其实,抛弃了“相对性原理”给物理学带来了非常大的麻烦,还不只是如何解释“迈克尔逊-莫雷实验”结果,至少在其它参照系下的电磁学理论如何修正就是一个不容易搞定的事。
正在这个物理学的“危急存亡之秋”,上天赐给了人类一个更加伟大的爱因斯坦,他老人家认为“相对性原理”绝不能放弃,反倒是“经典时空观”除了符合人类的直觉外,没有什么太多依据。由此,我们要谈一谈“相对性原理”啦。
二、为什么爱因斯坦坚信“相对性原理”
“相对性原理”说的是物理学规律在任何参照系中都应该是一样的,不随参照系的变化而变化。这里的物理学规律在一定意义上指的就是基础物理学的公式、方程等。
爱因斯坦坚信“相对性原理”应该源于他本人的人生观、世界观和价值观(看来三观果然是最重要的,三观一定要正哦)。他认为物理学规律应该是对称的,是美的。“对称”意味着“不变性”,就是说不同的参照系的物理学规律不应该发生变化。换句话说,“相对性原理”是写在爱因斯坦的价值观中的。
某种意义上,坚信“相对性原理”就是希望发现事物的本质规律,这不只是体现在希望物理学规律不随参照系变化而变化,也体现在希望物理学规律不随各种因素变化而变化,换句话说,它希望我们总结出来的物理学规律是放之四海而皆准的。例如,“马顿”发现苹果掉到地上了,总结出一个规律,说苹果被地球吸引;又发现鸟不掉到地上,可以在天上飞,总结出另一个规律,鸟不被地球吸引;过几天又发现鸵鸟不能飞,于是总结出第三个规律,鸵鸟是鸟中被地球吸引的;再过几天又发现鸡有的能飞、有的不能飞,于是总结出第四个规律…… 。显然,二傻子都知道这绝不会是物理学规律。同样解释这些现象,牛顿的理论就不用随着不同的东西而发生变化,所以牛顿是个伟大的科学家,而“马顿”则连二傻子都不如。
某种意义上,追求本质规律就意味着坚信“相对性原理”。麦克斯韦方程组得到了这么大量的实验验证,其形式又如此对称、优美,爱因斯坦当然认为它应该是适用于各个参照系的,何况还有“迈克尔逊-莫雷实验”撑腰。
我们今天看来,爱因斯坦这种价值观是他能够提出相对论的重要原因,也是他晚年一直追求建立统一场论的重要原因。爱因斯坦的这种价值观影响了大量的物理学家,今天众多的理论物理学家还在追求建立“大统一理论”、“万物理论”都是受这个价值观的影响。物理学家们梦寐以求的就是希望找到客观事物的终极规律,这个规律不因参照系的变化而变化,也不因作用的性质不同而不同。今天,我们在研究引力相关现象的时候,需要用到广义相对论;而在研究电磁力、弱作用的时候,需要用到弱电统一理论,这就不是对称的、优美的。如果有一天,我们真的可以把人类认识到的所有“作用”(包括引力、电磁力、弱作用、强作用、以及其它认识到的、没认识到的各种作用)统一成一个一致的物理学规律,那才是更对称、优美的,更符合“相对性原理”的精神。
到这儿,也许有人要问了,难道狭义相对论就凭着爱因斯坦的价值观和情怀得到了物理学家们的认可吗?当然不是。爱因斯坦的价值观决定了爱因斯坦会提出狭义相对论,但狭义相对论的正确性则是大量的物理学实验验证了的,不是因爱因斯坦本人的价值观而被确认的。所以我们才说狭义相对论是科学,而不是玄学、宗教。
那么,爱因斯坦基于自己的价值观提出“光速不变原理”和“相对性原理”两个假设后,会由此得出什么样的数学模型呢?又会如何影响人们对于时空的认识呢?
三、逻辑和数学显威力,狭义相对论时空变换(洛伦兹变换)推导
只基于前面的两条假设,我们就会得到狭义相对论给出的新的时空观,它全部的体现在新的参照系变换公式——洛伦兹变换——之内。
在推导洛伦兹变换之前,先多说几句为什么这个变换叫做洛伦兹变换。洛伦兹也是一位有着杰出贡献的物理学家、数学家,他为了解释迈克尔逊-莫雷实验,提出了在运动方向上物体的长度会缩短的假设,并基于这个假设给出了洛伦兹变换。基于洛伦兹变换,我们可以解释为什么迈克尔逊-莫雷实验中干涉条纹零移动的结果。但是,洛伦兹并不知道这个变换的本质含义是什么,他只是简单地认为由于某种尚不了解的物理学原因,造成了物体在运动方向上的长度变短了。洛伦兹本人在提出洛伦兹变换的时候完全没有认识到这实质上是一个时空观的问题。虽然洛伦兹本人没有认识到他提出的这个变换的重大意义,但是这个变换毕竟是洛伦兹先提出的,所以被人们称为“洛伦兹变换”而不是“爱因斯坦变换”。
好,闲言少叙,推导开始(对洛伦兹变换很熟悉或者对其推导不感兴趣的朋友可以跳过这段)。
所谓时空变换,其实就是不同参照系之间的空间位置和时间位置的变换关系。即使是在经典物理学中,也存在着时空变换,我们一般称之为伽利略变换。为了便于理解洛伦兹变换的推导,我们先简单的看一下经典物理学中的伽利略变换的样子,一看大家就能够理解,因为伽利略变换和我们日常感受到的时空观太一致了。
图1 两个X轴重合、Y轴Z轴平行的参照系(坐标系)S和S’,S’相对于S以速度v沿X轴正方向运动
在上面图1中,给出了两个参照系S和S’,每个参照系中都存在着一个用来标识空间位置的三维笛卡尔坐标系(三维直角坐标系),为方便起见,我们也称之为S和S’。这两个坐标系的X轴重合,Y轴和Z轴平行。参照系S’相对于S沿着X轴的正方向以速度v运动,并且在t=0的时刻两个坐标系的原点重合(注意到在这里我说t=0的时候,没有说是哪个参照系中的t,因为在经典时空观看来,时间是与参照系无关的)。
随便给出t时刻在参照系K中的一个点P,设其在S中的空间坐标为(x,y,z),并设在S’参照系中看来,P点坐标为(x’,y’,z’),时间为t’。那么显然按照我们经典时空观必然有
x
′
=
x
−
v
t
x'=x-vt
x′=x−vt
y
′
=
y
y'=y
y′=y
z
′
=
z
z'=z
z′=z
t
′
=
t
t'=t
t′=t
这四个等式就是经典时空观下不同参照系(指的是惯性参照系)间的时空变换关系——伽利略变换。我想,只要是熟悉坐标系的朋友都可以很方便的理解这组关系为什么成立。其实我们学习经典物理学的时候,特别是初中、高中的时候,从不特别介绍这组时空变换关系,因为这样的关系太显然了,不用专门来学。
好,有了这样的一个坐标系架构,我们来推导狭义相对论下的时空变换关系(我会尽量用简单的数学知识来完成推导,如果仍然觉得对推导过程理解有困难的朋友,也可以约略跳过)。仍然是同样的场景,但我们要基于狭义相对论的两个基础假设来进行推导,我们先一般性的设定变换关系如下
x
′
=
f
1
(
x
,
t
)
.
.
.
.
.
.
(
1
)
y
′
=
y
z
′
=
z
t
′
=
f
2
(
x
,
t
)
.
.
.
.
.
.
(
2
)
x'=f_1(x,t) \quad ......(1)\\ y'=y\\ z'=z\\ t'=f_2(x,t) \quad ......(2)\\
x′=f1(x,t)......(1)y′=yz′=zt′=f2(x,t)......(2)
这里面,我们针对Y轴和Z轴的变换直接设置为恒等变换,这是因为两个参照系相对速度的方向是X轴方向,与Y轴和Z轴垂直,同时也为了后面方便推导。毕竟本文是为了普及相对论知识,不是写专门的教材和论文。当然,感兴趣的读者也可以参照本文的方法,更加一般性的设定速度v的方向不是特定的,从而一般性的推导得到洛伦兹变换,推导过程会更复杂一些。在我后面的推导中,将不再考虑y’和z’。
由于狭义相对论的第一个假设“光速不变”与速度有关,为了能够得到速度的表达式,我们先对式(1)和式(2)进行全微分(不熟悉全微分的朋友,简单补充一下多元函数的偏导数、全微分的概念即可)得到
d
x
′
=
∂
f
1
(
x
,
t
)
∂
x
d
x
+
∂
f
1
(
x
,
t
)
∂
t
d
t
.
.
.
.
.
.
(
3
)
dx'=\frac{\partial f_1(x,t)}{\partial x}dx+\frac{\partial f_1(x,t)}{\partial t}dt \quad ......(3)
dx′=∂x∂f1(x,t)dx+∂t∂f1(x,t)dt......(3)
d
t
′
=
∂
f
2
(
x
,
t
)
∂
x
d
x
+
∂
f
2
(
x
,
t
)
∂
t
d
t
.
.
.
.
.
.
(
4
)
dt'=\frac{\partial f_2(x,t)}{\partial x}dx+\frac{\partial f_2(x,t)}{\partial t}dt \quad ......(4)
dt′=∂x∂f2(x,t)dx+∂t∂f2(x,t)dt......(4)
为了方便表示,我们令
∂
f
1
(
x
,
t
)
∂
x
=
K
11
(
x
,
t
)
\frac{\partial f_1(x,t)}{\partial x}=K_{11}(x,t)
∂x∂f1(x,t)=K11(x,t)、
∂
f
1
(
x
,
t
)
∂
t
=
K
12
(
x
,
t
)
\frac{\partial f_1(x,t)}{\partial t}=K_{12}(x,t)
∂t∂f1(x,t)=K12(x,t) 、
∂
f
2
(
x
,
t
)
∂
x
=
K
21
(
x
,
t
)
\frac{\partial f_2(x,t)}{\partial x}=K_{21}(x,t)
∂x∂f2(x,t)=K21(x,t) 、
∂
f
2
(
x
,
t
)
∂
t
=
K
22
(
x
,
t
)
\frac{\partial f_2(x,t)}{\partial t}=K_{22}(x,t)
∂t∂f2(x,t)=K22(x,t) ,并把它们简写为
K
11
、
K
12
、
K
21
、
K
22
K_{11} 、K_{12} 、K_{21} 、K_{22}
K11、K12、K21、K22 ,则式(3)和式(4)变为
d
x
′
=
K
11
d
x
+
K
12
d
t
.
.
.
.
.
.
(
5
)
dx'=K_{11}dx+K_{12}dt \quad ......(5)
dx′=K11dx+K12dt......(5)
d
t
′
=
K
21
d
x
+
K
22
d
t
.
.
.
.
.
.
(
6
)
dt'=K_{21}dx+K_{22}dt \quad ......(6)
dt′=K21dx+K22dt......(6)
为了得到速度的关系,我们让式(5)去除以式(6)得到
KaTeX parse error: Unexpected end of input in a macro argument, expected '}' at end of input: …dx}{dt}+K_{12}}
K
21
d
x
d
t
+
K
22
.
.
.
.
.
.
(
7
)
{K_{21}\frac{dx}{dt}+K_{22}} \quad ......(7)
K21dtdx+K22......(7)
显然,这里面的
d
x
′
d
t
′
\frac{dx'}{dt'}
dt′dx′ 就是S’参照系中某个质点的速度,而
d
x
d
t
\frac{dx}{dt}
dtdx 则是S参照系中同一个质点的速度。下面我要开始应用第一个基础假设“光速不变”了,
所谓光速不变,意思就是在S系中的某个质点如果速度为光速c,那么变换到S’系中后速度应该仍然是c,而不会是别的什么值。用式(7)中的各个物理量描述,就是在说当
d
x
d
t
=
c
\frac{dx}{dt}=c
dtdx=c 时,
d
x
′
d
t
′
\frac{dx'}{dt'}
dt′dx′必然恒等于c 。把这个关系代入式(7),我们得到了第一个关于求解系数K们的方程式(I)如下,
c
=
K
11
⋅
c
+
K
12
K
21
⋅
c
+
K
22
.
.
.
.
.
.
(
I
)
c=\frac{K_{11}\cdot c+K_{12}}{K_{21}\cdot c+K_{22}} \quad ......(I)
c=K21⋅c+K22K11⋅c+K12......(I)
然后我们要应用S’系与S系设定的一个基本关系,也就是S’系相对于S系以速度v向X轴正方向运动,来得到第二个和第三个方程式。这个关系的意思是,如果一个质点在S系中静止,即\frac{dx}{dt}=0 ,那么该质点在S’系中的速度 \frac{dx’}{dt’}=-v 。反过来,如果质点在S’系中静止,即\frac{dx’}{dt’}=0 ,那么在S系中看来的速度将是 \frac{dx}{dt}=v 。分别代入式(7),得到式(II)和式(III)
-v=\frac{K_{12}}{K_{22}}\quad …(II)
0=\frac{K_{11}\cdot v+K_{12}}{K_{21}\cdot v+K_{22}} \quad …(III)
根据以上(I)、(II)、(III)三个方程,我们可以解得如下关系,
K_{11}=K_{22}\quad …(8)
K_{12}=-\upsilon\cdot K_{22}\quad …(9)
K_{21}=-\frac{\upsilon}{c^2}\cdot K_{22}\quad …(10)
最后,我们需要应用第二个基础假设“相对性原理”来得到第四个方程式。前面我们得到了式(5)和式(6),这两个等式是用dx和dt来表示dx’和dt’的,我们基于这两个表达式推导,可以反过来用dx’和dt’表示dx和dt,这个过程就是解一个二元一次方程组,不多说了,结果如下
dx=\frac{K_{22}}{K_{11}K_{22}-K_{12}K_{21}}dx’-\frac{K_{12}}{K_{11}K_{22}-K_{12}K_{21}}dt’\quad …(11)
dt=\frac{-K_{21}}{K_{11}K_{22}-K_{12}K_{21}}dx’+\frac{K_{11}}{K_{11}K_{22}-K_{12}K_{21}}dt’\quad …(12)
再把式(8)、(9)、(10)代入到式(11)和(12),得到
dx=\frac{1}{(1-\frac{\upsilon2}{c2})\cdot K_{22}}dx’+\frac{\upsilon}{(1-\frac{\upsilon2}{c2})\cdot K_{22}}dt’\quad …(13)
dt=\frac{\frac{\upsilon}{c2}}{(1-\frac{\upsilon2}{c^2})\cdot K_{22}}dx’+\frac{1}{(1-\frac{\upsilon2}{c2})\cdot K_{22}}dt’\quad …(14)
式(5)和式(6)、式(13)和式(14)本质都是从一个参照系变换到另外一个参照系,只不过一个是从S系变换到S’系,另外一个正相反,从S’系变换到S系。那么这四个等式的系数之间必然存在着确定的关系。到底是什么关系呢?
这个关系是得到第四个独立方程的关键,得到了这第四个独立方程,我们才能够解出 K_{22} ,从而得到洛伦兹变换。一些文章或书籍中往往只是简单的给出洛伦兹变换必然是线性的,或者在假设dt=0而要求对应的dx与dx’的变换关系对称来得出这第四个独立方程。我这里给出一个相对严格一些的证明过程(这个证明过程只能说是相对严格,在微分几何中可以给出洛伦兹变换是线性的更加严格准确的证明)。
我们注意到“从S系变换到S’系”与“从S’系变换到S系”的唯一差别是X坐标轴的方向与相对运动的方向不同。如果我们让S系与S’系的X轴都变为原来的反方向的话,“从S’系变换到S系”就与现在的“从S系变换到S’系”完全一样了。坐标轴调换方向就是x变为-x,x’变为-x’,根据相对性原理,在这样的情况下,从S’系变换到S系的变换函数必然还是式(1)和式(2)中的 f_1 和 f_2 。也就是下面的等式必然成立,
-x=f_1(-x’,t’)\quad…(15)
t=f_2(-x’,t’)\quad …(16)
对式(15)和(16)做全微分,并注意到我们已经定义了\frac{\partial f_1(x,t)}{\partial x}=K_{11}(x,t) 、 \frac{\partial f_1(x,t)}{\partial t}=K_{12}(x,t) 、 \frac{\partial f_2(x,t)}{\partial x}=K_{21}(x,t) 、 \frac{\partial f_2(x,t)}{\partial t}=K_{22}(x,t) ,有
dx=K_{11}(-x’,t’)dx’-K_{12}(-x’,t’)dt’\quad …(17)
dt=-K_{21}(-x’,t’)dx’+K_{22}(-x’,t’)dt’\quad …(18)
对照式(17)、(18)与式(13)、(14),我们知道dx’与dt’前面对应的四个系数应该是严格相等的。再注意到式(5)至式(14)中用K表示的函数都是K(x,t)的简写,特别是式(8)至(10)告诉了我们几个K函数之间的关系,我们应用式(13)和式(17)中dx’前面的系数相等,可以列出下面的等式
\frac{1}{(1-\frac{\upsilon2}{c2})\cdot K_{22}(x,t)}=K_{11}(-x’,t’)=K_{22}(-x’,t’)\quad …(19)
由于函数 K_{22} 是 f_2(x,t) 关于t的偏导数,我们可以暂时把第一个变量x及-x’看作常数,再把式(2)表示的t’与t的关系代入式(19),得
K_{22}(f_2(t))\cdot K_{22}(t)=\frac{1}{1-\upsilon2/c2}\quad …(20)
当把第一个变量看作是常数后, K_{22} 实际成为了 f_2(t) 的导数,根据复合函数求导公式,式(20)可变换为
[f_2(f_2(t))]‘=\frac{1}{1-\upsilon2/c2}\quad …(21)
也就是 f_2 迭代2次得到的关于t的函数的导数是常数,从而
f_2(f_2(t))=\frac{1}{1-\upsilon2/c2}\cdot t+C\quad …(22)
函数 f_2 迭代2次得到的新函数是一个线性函数,由此我们可以证明 f_2(t) 也必然是t的线性函数(具体可参考已知f(f(x)),在怎样的条件下,可求f(x)? - 猪了个去的回答 - 知乎 https://www.zhihu.com/question/63745657/answer/216356554,或者在维基百科上查阅Functional square root)。
既然 f_2(x,t) 是t的线性函数,其对t的偏导数 K_{22}(x,t) 必然与t无关。
同样的道理,我们把 K_{22} 换成 f_1(x,t) 关于x的偏导数 K_{11} 的时候,可以得到 K_{11}(x,t) 也就是 K_{22}(x,t) 必然与x无关的结论。由此,我们知道了 K_{22} 是一个与x和t都无关的常数。于是,根据式(20),我们可以轻松得到 K_{22}=\frac{1}{\sqrt{1-\upsilon2/c2}} ,再根据式(8)、(9)、(10),我们得到四个系数如下,
K_{11}=K_{22}=\frac{1}{\sqrt{1-\upsilon2/c2}}
K_{12}=\frac{-\upsilon}{\sqrt{1-\upsilon2/c2}}
K_{21}=\frac{-\upsilon/c2}{\sqrt{1-\upsilon2/c^2}}
剩下的就很简单了,既然函数 f_1 和 f_2 关于x和t的偏导数都是常数,那么他们的表达式必然是x和t的线性组合,再把初始值x=0、t=0时,x’=0、t’=0代入,得到洛伦兹变换如下,
x’=\frac{1}{\sqrt{1-\upsilon2/c2}}\cdot x-\frac{\upsilon}{\sqrt{1-\upsilon2/c2}}\cdot t\quad …(V)
t’=\frac{-\upsilon/c2}{\sqrt{1-\upsilon2/c^2}}\cdot x+\frac{1}{\sqrt{1-\upsilon2/c2}}\cdot t\quad …(VI)
由此,我们得到了基于狭义相对论两个基本假设下推导出来的时空变换(洛伦兹变换)。从数学和逻辑上讲,只要狭义相对论两个基本假设成立,这个变换就必然成立。
这样一个变换将带来对于时空观的重新认识。
四、新时空变换带来的新时空观
洛伦兹变换带来的对时空观的重新认识的核心是同时的相对性。我们可以很容易从洛伦兹变换公式中看出这一点来。对于S系中的同处于时间t的两个点 x_1 和 x_2 ,根据式(VI),很容易知道变换得到的 t_1’ 和 t_2’ 并不相等,因为它们不只是与t有关,还与x有关,由于 x_1\ne x_2 ,所以 t_1’\ne t_2’ 。这个结论意味着,在S系中看来是同时发生的两件事,在S’系中看起来未必是同时发生的。
由于我们对于“时间是绝对的,与参照系无关”的认知根深蒂固,在日常生活中我们也确实无法感受到同时的相对性,所以很难习惯“同时是相对的”这样一个结论。从而,在理解狭义相对论时,我们时常会被一些错误的问题带入陷阱。特别是很多执着的反相对论人士,总是提出一些基于绝对时空观的似是而非的问题,使得不熟悉相对论时空观的朋友坠入云雾,以为相对论真的有问题。我这篇文章中不打算给大家继续推导什么钟慢效应、尺缩效应之类的,而是针对一些常见的相对论误导性问题,基于洛伦兹变换加以解释,从而在数学和逻辑的基础上告诉大家,我们实际所处的时空是个什么样子。
1、有关相对论时间的“傻问题”
某坚持反对相对论的民科提出了这样一个问题“相对论中的时间不同,是两个参照系中的时钟对比的结果。可是,一个参照系中虽然有无穷多的时钟,读数却只能有一个。分别假设为Ta与Tb,那么会出现Ta>Tb时,又能Ta<Tb的现象吗?”
这段话表述得很不严谨,但是意思还是能明白。它是说两个参照系相对运动,一个参照系S中看来相对另一个参照系S’静止的时钟变慢了,反过来也应该一样,S’中看来相对于S静止的时钟也变慢了,那么到底这两个时钟哪个慢了呢?
很多朋友看到这问题,马上觉得“对呀,相对论怎么解释这个问题呢?”
其实,这里面的核心问题还是对“同时的相对性”的理解。“一个参照系中虽然有无穷多的时钟,读数却只能有一个”,这句话的意思应该是说相对于某个参照系静止的无穷多个校准的时钟,其读数(在这个参照系中看来)都相同。关键在于,我们基于绝对时空观前提下,往往忽略括号中的那9个字,可是在相对论时空观下,这9个字万万忽略不得!是的,只是在与这些时钟相对静止的参照系中看来这些时钟读数都相同;如果是在一个与这些时钟相对运动的参照系中看过去,很遗憾,这些时钟的读数都不相同,或者说,在相对运动的参照系中看过去,这些时钟没有很好的校准!
如果我们坚信数学与逻辑的话,那么我们就应该知道在基于狭义相对论的两个基础假设前提下,洛伦兹变换必然成立。下面,我们就利用洛伦兹变换计算一下这些时钟到底是个什么情况。
如上图,我们仍基于前面推导洛伦兹变换的参照系假设。这回,我们在X轴上每隔一米摆满时钟,这些时钟都相对于S系静止。我们在S系中将这些时钟都校准,也就是在S系中看来,这些时钟的示数都相同并代表了S系中的时间。
下面我们要在S’系中(同时)观察这些时钟了。注意括号中的两个字,在习惯了绝对时空观的情况下我们都把它省略,但是在研究相对论问题的时候千万不能随便省略。我们是要在S’系中同时观察这些时钟的,但是S’系中的同时观察在S系中看来可不是同时的哦!
我们设在S’系的t’时刻观察S系中坐标为x的时钟,设这个时钟的示数为t(提醒一下这些时钟的示数表示的都是S系中的时间,t表示的就是在S’系中看来,S系中位置为x的点的时间)。根据式(VI),在已知x和t’时,t是未知数,我们希望求解的就是t。这种初一就学过的一元一次方程求解我就不详细说了,解得的结果为,
t
=
1
−
υ
2
/
c
2
⋅
t
′
+
υ
c
2
⋅
x
.
.
.
.
.
.
(
23
)
t=\sqrt{1-\upsilon^2/c^2}\cdot t'+\frac{\upsilon}{c^2}\cdot x\quad ......(23)
t=1−υ2/c2⋅t′+c2υ⋅x......(23)
这个解出来的t就是我们在S’系中观察到的S系中位置为x的时钟的示数。
再多说一句,有些人把不同参照系中时间不一致的现象归结为光从时钟上反射到观察者的眼睛中需要时间,不同位置的时钟需要的反射时间不同,从而造成时间差异。这个理解是完全错误的。我们计算出来的t就是S’系中t’时刻被观察那个钟的示数,没有考虑光从钟反射到观察者眼睛里面的时间。如果想要考虑这个因素,当然可以进一步计算研究,但这是一个额外的问题,不是狭义相对论讨论的内容。
根据式(23),如果我们在S’系中的t’=0的时刻观察这些时钟,我们会看到,
位置x=0的时钟示数为0;
位置x=1的时钟示数为 \upsilon/c^2 ;
位置x=2的时钟示数为2\upsilon/c^2 ;
…
很明显,在S’系中看来,这些时钟的示数都不相同。也可以说,在S’系中看来,这些时钟都没有很好地校准。
好了,上面的计算已经清楚地表明,“一个参照系中虽然有无穷多的时钟,读数却只能有一个”这句话的局限性,它只能在与时钟相对静止的参照系中成立。从而,这位民科看似矛盾的问题也就不攻自破了。
至于钟慢效应到底是怎么回事,有太多的相对论书籍在做介绍,我就不赘述了。
2、关于相对论的“怪问题”
一列静止长度为L的火车要穿过一个静止长度同样为L的山洞。在相对山洞静止的人看来,运动的火车长度变短从而小于L,因此在某一个时刻,火车会全部进入山洞中。如果山洞两头有两扇大门,那么在这个时刻就可以同时关闭这两扇大门,把火车整体关在山洞中。但是,在相对火车静止的人看来,山洞相对火车运动从而长度变短,火车长度要比山洞长,因此无论什么时候火车都不会整体在山洞内,从而不可能出现两扇大门同时关闭而把火车关在山洞中的情形。
那么到底是怎么回事呢?相对论错了么?
这个问题是学习狭义相对论时偶尔会碰到的习题。个人觉得这个问题是理解同时的相对性的非常好的例子。
下面我们仍然利用洛伦兹变换仔细计算一下不同参照系中看来这个过程中的事件发生的情形、先后顺序。
为了简化计算,我们仍然基于前面坐标系结构,并让S系相对山洞静止、S’系相对火车静止。假定t=0、t’=0两个参照系坐标原点重合的时刻,火车的末端和山洞的末端正好重合且位于两个坐标系的原点。如上图。
我们用 x_1 和 x_2 表示火车头和山洞前端在S系(相对山洞静止的参考系)中的位置坐标,用 x_1’ 和 x_2’ 表示它们在S’系中的位置坐标。
由于S系中t=0时火车末端和山洞末端重合,我们设定S系中此时山洞两扇大门同时关闭,也就是山洞前后端大门关闭的时刻都是0,特别的,山洞前端大门关闭的时刻 t_2=0 。显然,由于之前坐标系关系中已经设定t=0时刻两个坐标系原点重合且t’=0,所以在S’系中看来,也是在t’=0的时刻关闭了山洞末端的大门。我们再设在S’系中看来,山洞前端大门关闭的时刻为 t_2’ 。
好,各个参数设定完毕。现在按照这个设定我们再描述一次不同参照系中的情形。
在S系中看来,t=0时刻,火车末端和山洞末端坐标为0,火车前端坐标为 x_1 ,山洞前端坐标为 x_2=L (L是前面题目中山洞和火车在相对静止的参照系中看来的长度);且就在此时,山洞前后端的大门(位置分别为0和L)同时关闭。
在S’系中看来,t’=0时刻,火车末端和山洞末端坐标为0,火车前端坐标为 x_1’=L (因为火车相对S’系静止),山洞前端坐标为 x_2’ ;就在t’=0的此时,山洞末端的大门关闭。在 t_2’ 时刻,山洞前端大门关闭。
下面我们需要做的就是计算出 t_2’ 。根据洛伦兹变换公式(VI),
t
2
′
=
−
υ
/
c
2
1
−
υ
2
/
c
2
x
2
+
1
1
−
υ
2
/
c
2
t
2
t_2'=\frac{-\upsilon/c^2}{\sqrt{1-\upsilon^2/c^2}}x_2+\frac{1}{\sqrt{1-\upsilon^2/c^2}}t_2
t2′=1−υ2/c2−υ/c2x2+1−υ2/c21t2
=
−
υ
/
c
2
1
−
υ
2
/
c
2
⋅
L
+
1
1
−
υ
2
/
c
2
⋅
0
=\frac{-\upsilon/c^2}{\sqrt{1-\upsilon^2/c^2}}\cdot L+\frac{1}{\sqrt{1-\upsilon^2/c^2}}\cdot 0
=1−υ2/c2−υ/c2⋅L+1−υ2/c21⋅0
=
−
υ
/
c
2
1
−
υ
2
/
c
2
⋅
L
.
.
.
.
.
.
(
24
)
=\frac{-\upsilon/c^2}{\sqrt{1-\upsilon^2/c^2}}\cdot L\quad ......(24)
=1−υ2/c2−υ/c2⋅L......(24)
显然, t_2’<0 。这意味着在S’系中看来,山洞前端的大门关闭时间要早于山洞末端大门关闭。
我们还可以进一步计算一下在S’系中看来, t_2’ 这个时刻山洞末端的位置坐标,不妨把它设为 x_{2_0}’ 。
由式(VI),我们先计算得到S’系中 t_2’ 时刻,在S系中位置为0的点的时间,设为 t_0 。
t
0
=
1
−
υ
2
/
c
2
⋅
t
2
′
=
−
υ
⋅
L
c
2
t_0=\sqrt{1-\upsilon^2/c^2}\cdot t_2'=-\frac{\upsilon\cdot L}{c^2}
t0=1−υ2/c2⋅t2′=−c2υ⋅L
再代入式(V),得到
x
2
_
0
′
=
υ
2
/
c
2
1
−
υ
2
/
c
2
⋅
L
x_{2\_0}'=\frac{\upsilon^2/c^2}{\sqrt{1-\upsilon^2/c^2}}\cdot L
x2_0′=1−υ2/c2υ2/c2⋅L
显然x_{2_0}’ 大于0,而我们知道在S’系中看来火车的末端位置坐标总是0,这意味着在S’系中看来,山洞前端大门关闭的时候,火车末端还没有进入山洞。
好,让我们最后在描述一次两个参照系中的情形。
在S系中看来,t=0时刻火车末端刚刚进入山洞,此时山洞前后端大门同时关闭。
在S’系中看来, t_2’=\frac{-\upsilon/c2}{\sqrt{1-\upsilon2/c^2}}\cdot L<0 的时候,火车末端尚未进入山洞时,山洞前端大门已经关闭;然后在t’=0时刻,火车末端进入山洞,此时山洞末端大门关闭。
好啦,啰嗦了这半天,就是想通过洛伦兹变换严格计算告诉大家,这个所谓的“怪问题”在狭义相对论时空观下一点也不奇怪,在一个参考系中看来同时关闭的两扇大门,在另外一个参考系中看来不是同时关闭的,仅此而已。
当然,如果大家感兴趣,还可以计算一下为了不让火车撞上山洞前端的大门,需要及时打开山洞前端大门,此时山洞前端大门打开的时间与山洞末端大门关闭的时间在S’系中看来是怎样的先后顺序呢?
3、关于“双生子佯谬”
这是一个更加经典的狭义相对论问题。经常引起的质疑是“既然互为相对运动,为什么一定是坐飞船飞出去的那个孩子年轻?相对飞船来说,地球不也是飞走后又飞回来吗?为什么不是在地球上的孩子年轻呢?”
这个问题相对更复杂一些。知乎上文章写得太长实在很累,我就不给大家详细计算了。这个问题的核心是我们把地球看做一个惯性参照系,而飞出去又飞回来的飞船则发生了变速运动,因此在整个过程中不能看成一个惯性系。所以,地球相对飞船固然也是飞走后又飞回来,但是由于飞船不是惯性系,不能直接用惯性系之间的洛伦兹变换处理,不过最终的结果还是飞船上的孩子年轻。文章来源:https://www.toymoban.com/news/detail-669712.html
先说到这里吧。越写越觉得狭义相对论的时空观如果单凭网上码字,实在不容易说得很明白。如果能当面沟通,拿个白板连说带画再加上手势比划,可能更能让人容易想通。文章来源地址https://www.toymoban.com/news/detail-669712.html
到了这里,关于狭义相对论的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!