相对论之狭义引论

纵观当下,“相对论”这一名字几乎可以说是无人不知无人不晓了。了解得多一点的可能会听说过高速运动下时钟会变慢这一类说法。相对论的知名度如此之高也是自然的——它和量子理论齐名,是上个世纪的物理学的巅峰成就,从根本上改变了我们对世界的看法。

本文的目的在于对狭义相对论的一些基本的相关内容作一点梳理,并且不引入过于深入的数学——更多讲述物理、更少暴力数学。会涉及到相对论基本原理和Lorentz变换;运动学、动力学的一些讨论;相对论下的电磁场。

引言

“相对”一词的潜台词是参照物的存在。我们测量一段过程的时间长短,其实是测量持续过程里“秒表”走了多少次;测量一个物体的长度,其实是测量它从零开始延展了一个标准尺多少的位置。如果测量工具不完全相同,那么就会测出不一样的结果,因此“一个过程恰好持续了1s”准确些来说应该是“这个过程在我的秒表测来刚好是1s”。我们只是测出来了相对的时间和空间。我们知道度量衡的统一是历史上的一大进步,因而我们自然会设想一种绝对时空的存在。

经典物理里就认为,时间和空间是绝对的。牛顿在他著名的“自然哲学的数学原理”中说:“绝对的、真正的数学时间,出于其本性而自行均匀地流淌着,与外界任何事物无关”、“绝对的空间,永远保持不变和不动,与外界任何事物无关”。

这样,如果一个物体单独置于这个绝对的空间中,那么它将会在绝对时间之下做匀速直线运动,或是保持静止。这是牛顿第一定律阐释的现象,而第二定律则表明是力的存在改变了这一默认的状态。不难发现,如果没有这一绝对的时空,那么牛顿力学就会遇到一些难处。想象拿一根轻绳挂一个小球,拿着绳子另一端让小球水平地转起来,利用牛顿第二定律可以解释为是绳子给小球提供了向心力,从而能做圆周运动。这里的圆周运动是以我们自身为参照系来观察的,假如以小球自身为参照系,则观察到万事皆转而唯我静止,这样情况就变成了:小球在绳子拉力作用下静止不动。出现这种问题说明牛顿定律需要在特定参照系下应用,也就是所说的惯性系,于是问题变为了惯性系的判定问题。不难发现相对于惯性系做匀速直线运动的物体作为参照系也会是惯性系,所以要判断是不是惯性系,只需要看它相对于另一已知的惯性系是否匀速直线运动,但这样又会产生凭什么认定那另外的惯性系是惯性系的问题。这样追问下去,迟早要问“第一惯性系是什么”。牛顿理论里认定绝对空间的存在,解决了这一问题。

经典时空观非常自然,似乎无可指摘。然而历史上著名的Michelson–Morley实验却使其暴露出问题了。这是一个测量光速的实验,通过测量不同参照系中光的速度,得出光在其设想的介质“以太”中的传播速度。实验的结果确是惊人的,无论如何在不同的时间重复多次实验,测得的光速只有一个,也就是说这个速度不为参照系变动而变动。经典运动学对此难以解释,因为速度的测量会因为参照系的变动而变动:假如在地面上观察一个在扶手电梯上往上行走的人,那么我们会观察到一个比正常步行更快的速度,因为扶梯也“给”了速度;而如果这个人往下行走,那么其速度就会因为被扶梯抵消一部分而显得更慢。现在,Michelson–Morley实验却表明:光速c是绝对的,在任何参照系任何方向都一样。于是,以太的概念是多余的,应予剔除。但经典理论还是无法解决光速不变的问题,狭义相对论于是随之创立。

两基本原理与Lorentz变换

两基本原理

“绝对时空”与“光速恒定”这一矛盾说明,我们必须舍弃其一。如果并不相信光速恒定,那么需要对经典理论进行修补,历史上已有很多并不成功的尝试。其实早在Maxwell的电磁理论中就可以看到光速是一个常量了,如果不认可,就说明Maxwell方程组只在部分参照系成立,这其实是难以想象的。

狭义相对论则认可了Maxwell方程组在所有参照系成立,于是也就认可了光速确实为常量。那么问题就出现在对绝对时空的认定上了!在抛弃绝对时空的想法后,狭义相对论的出发点是两个基本原理。

  • 相对性原理:相对做匀速直线运动的惯性系间,所有的物理定律有相同的形式。
  • 光速不变原理:在所有惯性系中测量到的光速c都是一样的。

我们已经看出,光速不变原理的认定是不平凡的,因为它否定了绝对时空。相对性原理其实也是不平凡的。在经典力学中,认定相对性原理对力学定律的成立并不会给我们带来多少新的东西,而在狭义相对论里,相对性原理并不局限于力学定律,还包括了电磁学等在内的所有物理定律,认定这是可以做到的。

“同时”的确认

我们想要把一个参照系的时空坐标变换到另一个参照系。设两个参照系间的相对运动速度为恒速v,这个v是以其中一个参照系而言的。在时刻t=0我们在该参照系中以一个点为原点,另一个参照系相对运动的方向为x轴正向建系,然后把一个空间坐标为(x,y,z)的点对应的时空坐标写成(x,y,z,t);对另一个参照系也在此刻一致地建系。我们的假设就是参照系2的原点O'在参照系1观察下就是x _ {O'}=vt

由于抛弃了绝对时空,第二个参照系所用的时间t'和第一个的t不一定一致。那么这里就有了个问题:如何联系起来两套时间系统?打比方来说,在一条公路上自行车和汽车比赛,我们知道自行车的速度和汽车的速度,但要知道它们的相对位置关系,也就是把二者各自参照系下的坐标联系起来,却是需要:二者都对路上的某个点,例如说共同的起点,有相同的认知。如果自行车选定了一个起点,汽车却没办法知道它相对这个起点在哪里,从而起点无法一致,那么这个比赛也就没有了意义。

回到原来的问题,如果一个参照系选定一个时刻作为时间的零点t=0,另一个参照系能否“同时地”将这一时刻校准为自己的时间零点t'=0?这不是一个非常显然的问题,因为我们需要确切地知道什么是“同时”。假如一个人A在地球要和一个1光年外的另一个人B校准时间,2025年地球上的事件在1光年外需要到2026年才知道,因此B现在要让自己的时间设置到2026年,这样A在2026年会观察到B把时间设置到2026,从而同步。但是,假设为了验证同步成功,A说现在是2026年,B观察到A这一时间时本地时间却显示是2027+1年传播时间=2028年,不仅没有同步反而还差了两年。这就说明,光速有限导致了这种同步不可能对两边同时成立。

为了进一步说明“同时”的非平凡性,再考虑另外一个例子。假设一辆横放火车中间有一盏灯,一个观察者在灯的位置观察到灯光到达火车左右两边是同时的,因为距离和光速都相同。但是在地面上看来,火车往右开时,光到左边时走过的距离比到右边的距离短,由于光速不变,到达左边的时间会早于到达右边的时间。

把光速考虑进去可以按如下方案同步时钟:A在2025年(记为t _ 1)发出一个信号,B在某时刻接收到信号后立刻回复一个信号,A会在2027(记为t _ 2)收到回复信号,如果B收到A信号时的本地时间是(t _ 1+t _ 2)\mathbin/2,那么我们就可以认为A,B的时间达成了同步。

Lorentz变换

现在我们试着从两基本原理出发,推导Lorentz变换。

承接上文,我们已经能够做到时间同步,因此可设t=0时另一参照系也是t'=0。假设参照系F的时空坐标(x,y,z,t)变换到参照系F'(x',y',z',t'),进行的变换为
\boldsymbol r'=\boldsymbol f(\boldsymbol r,t),\quad t'=g(\boldsymbol r,t).在任一时刻t,取F中的一个点\boldsymbol r,其在F'中为\boldsymbol r'。现在我们在t=0处重新在另一个原点建系,只是将坐标系平移。在新的F参照系下,设原来的原点现在的新坐标为\boldsymbol r _ 0,那么原来坐标为\boldsymbol r的点的新坐标为\boldsymbol r+\boldsymbol r _ 0,在F'参照系下时刻t'的新时空坐标为\boldsymbol f(\boldsymbol r+\boldsymbol r _ 0,t),那么:
\boldsymbol f(\boldsymbol r,t)-\boldsymbol f(\boldsymbol 0,t)=\boldsymbol f(\boldsymbol r+\boldsymbol r _ 0,t)-\boldsymbol f(\boldsymbol r _ 0,t).这个式子是说F中的一个向量经过\boldsymbol f变换后总能得到F'中同一个向量,无论建系的原点位置如何。这是自然的,因为空间里所有点都是一样的,可以任意取点建系。

现在令\boldsymbol F(\boldsymbol r)=\boldsymbol f(\boldsymbol r,t)-\boldsymbol f(\boldsymbol 0,t),那么可以证明\boldsymbol F(\boldsymbol r _ 1+\boldsymbol r _ 2)=\boldsymbol F(\boldsymbol r _ 1)+\boldsymbol F(\boldsymbol r _ 2)
\begin{aligned}\boldsymbol F(\boldsymbol r _ 1)+\boldsymbol F(\boldsymbol r _ 2)&=\boldsymbol f(\boldsymbol r _ 1,t)-\boldsymbol f(\boldsymbol 0,t)+\boldsymbol f(\boldsymbol r _ 2,t)-\boldsymbol f(\boldsymbol 0,t)\\
&=\boldsymbol f(\boldsymbol r _ 1+\boldsymbol r _ 2,t)-\boldsymbol f(\boldsymbol r _ 2,t)+\boldsymbol f(\boldsymbol r _ 2,t)-f(\boldsymbol 0,t)\\
&=\boldsymbol F(\boldsymbol r _ 1+\boldsymbol r _ 2).
\end{aligned}
这让我们想起Cauchy函数方程f(x)+f(y)=f(x+y),这里是多维版本。不难推广,当连续性条件满足(或是单调性/局部有界)时,这个方程一样也只有线性解,于是\boldsymbol F(\boldsymbol r)=\boldsymbol f(\boldsymbol r,t)-\boldsymbol f(\boldsymbol 0,t)=A _ {v,t}\boldsymbol r,从而由\boldsymbol f(\boldsymbol r,t)-\boldsymbol f(\boldsymbol 0,t)=\boldsymbol f(\boldsymbol r+\boldsymbol r _ 0,t)-\boldsymbol f(\boldsymbol r _ 0,t)可知\boldsymbol f(\boldsymbol r+t{\boldsymbol v},t)=A _ {v,t}\boldsymbol r+\boldsymbol f(t{\boldsymbol v},t)=A _ {v,t}\boldsymbol r,这里我们代入了\boldsymbol f(t\boldsymbol v,t)=\boldsymbol 0,所以
\boldsymbol r'=\boldsymbol f(\boldsymbol r,t)=A _ {v,t}(\boldsymbol r-t\boldsymbol v).通过分析不难得知A _ {v,t}应是对角的,所以上式写成分量形式就是
x'=A _ {v,t}^x(x-vt),\quad y'=A _ {v,t}^yy,\quad z'=A _ {v,t}^zz.\boldsymbol v反向、带撇和不带的交换,就得到逆变换:x=A _ {v,t'}^x(x'+vt'), y=A _ {v,t'}^yy', z=A _ {v,t'}^zz'。先看y,z,这些方向上两参照系是对称的,因此A _ {v,t}^y,A _ {v,t}^z只能是\pm1,我们舍去负值,就得到了y'=yz'=z。现在只剩x't'形式还未确定,目前得到的是x'=A _ {v,t}^x(x-vt)t'=(x-A _ {v,t'}^xx')\mathbin/(A _ {v,t'}^xv)

下面通过进一步考虑光速不变原理来导出具体表达式:

  • 参照系F中由原点朝x正向发射的光的坐标是(ct,t),在F'中的坐标是(ct',t'),那么
    \begin{aligned}&ct'=A_{v,t}^x(c-v)t,\quad ct=A_{v,t'}^x(c+v)t'\\\implies{}&\frac{t'}t=\frac{A_{v,t}^x(c-v)}c=\frac c{A_{v,t'}(c+v)}\\\implies{}&A_{v,t}^xA_{v,t'}^x=\frac{c^2}{c^2-v^2}=\frac1{1-v^2/c^2}.\end{aligned}

  • 参照系F中由原点朝y正向发射的光的坐标是(0,ct,0,t),在F'中的坐标是(-vt',\sqrt{(ct')^2-(vt')^2},0,t'),那么x轴上-vt'=-A_{v,t}^xvty轴上ct=\sqrt{c^2-v^2}t',这表明A_{v,t}^x=c\mathbin/\sqrt{c^2-v^2}

这样我们就解出了A_{v,t}^x,A_{v,t'}^x,它们都与t,t'无关且都等于c\mathbin/\sqrt{c^2-v^2}。所以
\begin{aligned}&x'=Ax-Avt\\\implies{}&t'=\frac{x-Ax'}{Av}=\frac{x-A^2x+A^2vt}{Av}=At-\frac{(A^2-1)x}{Av}\\\implies{}&t'=A\Big[t-\Big(1-\frac1{A^2}\Big)\frac x v\Big]=A\Big(t-\frac v{c^2}\cdot x\Big).\end{aligned}
习惯上A的高频出现使得通常会用一个专门的字母表示它:\gamma。这样全部的变换都推导出来了:

Lorentz变换:令
\gamma=\frac1{\sqrt{1-\frac{v^2}{c^2}}},那么Lorentz变换为
\begin{aligned}x'&=\gamma(x-vt),\quad y'=y,\quad z'=z,\\
t'&=\gamma\Big(t-\frac {vx}{c^2}\Big).
\end{aligned}
逆变换为
\begin{aligned}x&=\gamma(x'+vt'),\quad y=y',\quad z=z',\\
t&=\gamma\Big(t'+\frac {vx'}{c^2}\Big).
\end{aligned}

光速单位化

我们更改时间的单位,使原先坐标为(x,y,z,t)的点现在为(x,y,z,t/c),也就是原来的1秒等于新的c“秒”,原来的v米每秒等于新的v/c米每“新秒”,光速由c变为了1,这种做法能有效简化公式。此时\gamma=1/\sqrt{1-v^2},Lorentz变换写为x'=(x-v t)\mathbin/\sqrt{1-v^2}t'/c=(t/c-cvx/c^2)\mathbin/\sqrt{1-v^2},即t'=(t-vx)\mathbin/\sqrt{1-v^2}​,从中我们已经能够看到一些对称性。

写成矩阵形式
\begin{bmatrix}t'\\x'\end{bmatrix}=\frac1{\sqrt{1-v^2}}\begin{bmatrix}
1&-v\\-v &1
\end{bmatrix}\begin{bmatrix}t\\x\end{bmatrix}.

我们回顾一下二维空间中的旋转。设(x,y)绕原点旋转\theta得到(x',y'),并设(x,y)对应极坐标为(r,\theta _ 0),那么x'=r\cos(\theta _ 0+\theta)=r(\cos\theta _ 0\cos\theta-\sin\theta _ 0\sin\theta)=x\cos\theta-y\sin\theta,同理可得y'=x\sin\theta+y\cos\theta。现在假设旋转的不是点而是坐标轴,那么旋转\theta相当于点来旋转-\theta,于是x'=x\cos\theta+y\sin\thetay'=-x\sin\theta+y\cos\theta。如果写出矩阵形式,从(x,y)变换到(x',y')的矩阵为
\begin{bmatrix}\cos\theta&\sin\theta\\-\sin\theta&\cos\theta\end{bmatrix}=\cos\theta
\begin{bmatrix}1&\tan\theta\\-\tan\theta&1\end{bmatrix}=\frac{\pm1}{\sqrt{1+\tan^2\theta}}\begin{bmatrix}1&\tan\theta\\-\tan\theta&1\end{bmatrix}.
与Lorentz变换的矩阵有一定相似。我们需要考虑的是双曲函数\sinh x=(\mathrm e^x-\mathrm e^{-x})\mathbin/2\cosh x=(\mathrm e^x+\mathrm e^{-x})\mathbin/2,和\tanh x=\sinh x/\cosh x,那么有
\cosh ^2x-\sinh^2x=1;\quad \sinh x=\frac{\tanh x}{\sqrt{1-\tanh ^2x}};\quad \cosh x=\frac{1}{\sqrt{1-\tanh^2x}}.现在令v=\tanh \phi,那么Lorentz变换现在写成了
\begin{bmatrix}t'\\x'\end{bmatrix}=\begin{bmatrix}
\cosh\phi&-\sinh \phi\\-\sinh\phi &\cosh \phi
\end{bmatrix}\begin{bmatrix}t\\x\end{bmatrix}.
式中的\phi被称作rapidity。

相对论运动学

速度

从坐标的Lorentz变换来看,时间和空间“纠缠”在了一起,使得很多直觉都不能理所当然了。从位置衍生出来的速度,也要重新考量。

假设仍按上述所说方式建系,我们要把参照系F的一个物体的速度变换到另一个参照系F'。在F中的速度计算为\Delta x/\Delta t,\Delta y/\Delta t,\Delta z/\Delta t的极限值,在F'中,
\frac{\Delta x'}{\Delta t'}=\frac{\Delta x-v\Delta t}{\Delta t-v\Delta x/c^2}\implies u _ x'=\frac{u _ x-v}{1-u _ xv/c^2}.同理可得
u _ y'=\frac{u _ y}{\gamma(1-u _ xv/c^2)},\quad u _ z'=\frac{u _ z}{\gamma(1-u _ xv/c^2)}.
反过来,从F'F的变换为
u _ x=\frac{u _ x'+v}{1+u _ x'v/c^2},\quad u _ y=\frac{u _ y'}{\gamma(1+u _ x'v/c^2)},\quad u _ z=\frac{u _ z'}{\gamma(1+u _ x'v/c^2)}.
现在设v=\beta cu'=\beta _ 1' c,并设其方向沿x轴向,那么\beta _ 1:=u/c=(\beta _ 1'+\beta)\mathbin/(1+\beta _ 1'\beta _ 1)

考虑v\ll c,此时u _ x\approx u _ x'+v,符合经典力学的结论。

钟慢与尺缩

我们来看钟慢效应。假设一个秒表静止放置,每过\Delta t _ 0就报时一次。现在让它以速度vx轴正向运动,在秒表系它还是每隔\Delta t'=\Delta t _ 0报时一次,设地面系测量到它报时间隔为\Delta t,那么由Lorentz变换
\begin{aligned}
& t _ 1=\gamma(t _ 1'+vx'/c^2),\quad t _ 2=\gamma(t _ 2'+vx'/c^2),\\
\implies{}&\Delta t=t _ 2-t _ 1=\gamma(t _ 2'-t _ 1')=\gamma\Delta t'.
\end{aligned}
注意到\gamma=1/\sqrt{1-v^2/c^2}\geqslant 1,这也就表明地面观测到运动的秒表报时间隔变大到了原来的\gamma倍,所以看起来走得慢了。

再来看尺缩效应。假设一把尺静止平行x轴放置,那么其长度就是L _ 0=x _ b-x _ a,这里a,b是它的两端点。现在如果它以速度vx轴正向运动,那么在尺子系里的任意时刻t'还是测得L _ 0=x' _ b-x _ a',设在地面系测量长度为L,由Lorentz变换
\begin{aligned}
&x _ b'=\gamma(x _ b-vt),\quad x _ a'=\gamma(x _ a-vt),\\
\implies{}&L _ 0=x _ b'-x _ a'=\gamma(x _ b-x _ a)=\gamma L.
\end{aligned}
这表明运动的尺子测量起来缩到了原来的1/\gamma,静止的尺子量起来是最长的。

相对论动力学

我们现在推导相对论下的动量、能量的可能形式,希望推广后仍有动量守恒定律和能量守恒定律。

动量

先来看动量。假设其形式可写成\boldsymbol p=m(v)\boldsymbol v,在v=0时质量函数为静质量:m(0)=m _ 0。我们考虑两个微粒A,B的碰撞,并假设高度的对称性:A,B有等大反向的速度,静质量都是m _ 0,进行完全弹性碰撞。那么,A,B碰撞后也应该会有一个完全对称的偏转,这个碰撞就可以在一个平面内考虑。我们总可以按如下所说建系:A,B碰撞所形成的各自轨迹关于y轴对称,A从第三象限出发,碰撞后到第四象限;B从第一象限出发,碰撞后到第二象限。

由于考虑的是弹性碰撞,A,B碰撞后的速度也应是大小不变的。于是现在可知A,B的x速度不变而y速度各自反向。

现在考虑一个与A的x速度相同地运动的参照系F _ A,设A在y轴上。在这个参照系看来,A的运动是从y轴负向出发,碰撞后原速反向,设这个速度是u;设B在F _ A参照系下运动的x向速度大小是v,可以证明B的y向速度大小是u/\gamma,其中\gamma=1/\sqrt{1-v^2/c^2}:对称地,考虑与B的x速度相同地运动的参照系F _ B,那么F _ A相对F _ B的速度是vF _ B下B没有x向速度,y向速度大小为u,于是由速度变换式,在F _ A下B的y向速度大小为u/\gamma(1+0)=u/\gamma

现在,列出F _ Ay向的动量守恒方程:B的速度大小为w=\sqrt{v^2+u^2/\gamma^2},方程就可写为
m(u)u-m(w)u/\gamma=-m(u)u+m(w)u/\gamma\implies m(w)=\gamma m(u).u\to 0,那么w\to v,以及m(u)\to m _ 0,这样
m(v)=\gamma m _ 0=\frac{m _ 0}{\sqrt{1-v^2/c^2}}.这表明动量的相对论推广是
\boldsymbol p=m\boldsymbol v=\gamma m _ 0\boldsymbol v.式中的函数m可称为相对论质量,是质量的线性函数。在v\ll cp\approx m _ 0 v,回到了经典形式。

能量

现在考虑能量。假设外力使物体从A到B,做功为
\begin{aligned}
W&=\int _ A^B\frac{\mathrm d\boldsymbol p}{\mathrm dt}\cdot \mathrm d\boldsymbol s=\int _ A^B\gamma m _ 0\frac{\mathrm d\boldsymbol v}{\mathrm dt}\cdot\mathrm d\boldsymbol s=\int _ A^B\gamma m _ 0\frac{\mathrm d\boldsymbol v}{\mathrm dt}\cdot\boldsymbol v\, \mathrm dt\\
&=\int _ A^B\frac{\mathrm d}{\mathrm dt}\frac{m _ 0\boldsymbol v}{\sqrt{1-v^2/c^2}}\cdot\boldsymbol v\, \mathrm dt=\int _ A^B\boldsymbol v\cdot\mathrm d\frac{m _ 0\boldsymbol v}{\sqrt{1-v^2/c^2}}\\
&=\frac{m _ 0 v^2}{\sqrt{1-v^2/c^2}}\bigg| _ A^B-\int _ A^B\frac{m _ 0 v}{\sqrt{1-v^2/c^2}}\, \mathrm d v\\
&=\frac{m _ 0 v^2}{\sqrt{1-v^2/c^2}}\bigg| _ A^B+\int _ A^B m _ 0c^2\, \mathrm d\sqrt{1-v^2/c^2}\\
&=\frac{m _ 0 v^2+m _ 0c^2(1-v^2/c^2)}{\sqrt{1-v^2/c^2}}\bigg| _ A^B\\
&=\frac{m _ 0 c^2}{\sqrt{1-v^2/c^2}}\bigg| _ A^B.
\end{aligned}

E=mc^2=\gamma m _ 0c^2,
其中\gamma=1/\sqrt{1-v^2/c^2},那么W=E _ b-E _ a。这个E被认为是这个物体的总能量,包括动能等任何形式的能量。令v=0,得静止时的能量m _ 0c^2,假设W的做功全部转换为动能,物体在A时静止,利用1/\sqrt{1-x}\approx1+1/2\cdot x,则得到的动能为
K=(\gamma-1)m _ 0c^2\approx\frac{v^2}{2c^2}m _ 0c^2=\frac12m _ 0v^2.这就导出了经典力学里的动能表达式。

我们还可以将动量\boldsymbol p=\gamma m _ 0\boldsymbol v和能量E=\gamma m _ 0c^2联系起来。经典力学里,动能和动量的关系为E _ k=p^2/2m,现在我们也试计算动量平方。注意到c^2p^2/E^2=c^2\gamma^2m _ 0^2v^2/\gamma^2 m _ 0^2c^4=(v/c)^2,所以1/\gamma^2=1-c^2p^2/E^2,从而
\begin{aligned}
&E^2/\gamma^2=E^2-c^2p^2\\
\implies{}&(m _ 0c^2)^2=E^2-c^2p^2\\
\implies{}&E^2=(m _ 0c)^2+(cp)^2.
\end{aligned}

相对论允许静质量为0时动量非0,如光子。在p=\gamma m _ 0v中,令v\to cm _ 0\to0,则\gamma\to+\infty,如果1/\gammam _ 0是同阶无穷小,那么p就是一个常数阶的大小。现在考虑一个静质量m _ 0=0的光子,由上式可知其能量满足E^2=0+(cp)^2,如果再代入E=h\nu,那么可得动量为
p=\frac{h\nu}c.其中\nu是波长,上式也可写为p=h\lambda,而\lambda是波长。

相对论的电与磁

相对论下的电与磁是统一的。我们知道静止的电荷通过静电场相互作用,可以用Coulomb定律描述它们间的静电力,但是当电荷分别运动形成电流时,考虑相对论,电荷要额外受到一个和自身速度垂直、大小也和速度成比例的力。此时引入磁场的概念的话,这个力就认为是另一个电荷形成的磁场施加的。

这里不考虑电荷的定义、测量等问题,只是简单地认为实验能够支持:1. 电荷无论静止、运动,能够被良好定义,被测定;2. 电荷守恒,即电荷不会凭空产生,也不会凭空消失;3. 电荷不变,即任意变换惯性系,测量得到的是相同的电荷。这样,我们可以应用Gauss定律:
Q/\epsilon _ 0=\int _ {S} \boldsymbol E\cdot\mathrm d\boldsymbol a.

运动电荷产生的磁场

电荷运动时,产生的电场与静电场是不一样的。

:考虑一个无限大均匀带电平面,电荷密度\sigma,那么由Gauss定律,平面产生的场强大小是各处相等的,为\sigma/2\epsilon _ 0,方向垂直远离平面。再考虑在平面正上方放一无限大电荷密度-\sigma的平面,那么现在只在两板间有\sigma/\epsilon _ 0的电场,两板外为零。然后,考虑一个平行于平面方向运动的惯性系F',在这个参照系中会有什么样的观察?

设平面为xy平面方向,F'运动方向为x向,速度为v,那么,原来的F参照系的单位面积里,会由于相对论效应而在F'观察到1/\gamma的压缩,而惯性系变换时电荷不变,这表明电荷密度会发生\gamma倍的膨胀。

F'系看来,虽然两平面在移动,但是由于我们特殊的设计,两板间必然还是只有z'向均匀电场,因为垂直z'向的可能的电场会因为两平面的相反电荷而抵消(实际上也并没有)。于是我们还是可以用Gauss定律,板间电场为\sigma'/\epsilon _ 0=\gamma\sigma/\epsilon _ 0,这表明
E _ z'=\gamma E _ z.现在假设两板平行于yz平面放置,其余不变,此时电荷面密度不变,F'观测到的电场
E _ x'=E _ x.


这个例子里,对于垂直参照系运动方向的板间电场,F'会观测到变大\gamma倍;对于平行运动的,F'观测到不变的电场。这是个具有一般性的变换。

:考虑一个沿x正向匀速运动的点电荷Q,在Q静止的参照系,电场为
E' _ x=\frac{Q}{4\pi\epsilon _ 0r^{'2}}\cos\theta=\frac{Qx'}{4\pi\epsilon _ 0r^{'3}},\quad E' _ y=\frac {Qy'}{4\pi\epsilon _ 0r^{'3}}.现在求E _ x,E _ y,然后求出E。令t'=0,由Lorentz变换,
\begin{gathered}
E _ x=E _ x'=\frac{Q}{4\pi\epsilon _ 0}\frac{\gamma x}{(\gamma ^2x^2+y^2)^{3/2}},\\
E _ y=\gamma E _ y'=\frac{Q}{4\pi\epsilon _ 0}\frac{\gamma y}{(\gamma^2x^2+y^2)^{3/2}}.
\end{gathered}
注意到E _ x:E _ y=x:y,这表明运动电荷Q的电场仍是径向。
\begin{aligned}
E&=\sqrt{E _ x^2+E _ y^2}=\frac{Q}{4\pi\epsilon _ 0}\frac{r}{\gamma^2(x^2+y^2/\gamma^2)^{3/2}}\\
&=\frac{Q}{4\pi\epsilon _ 0}\frac{r}{\gamma^2r^3[1-(1-1/\gamma^2)y^2/r^2]^{3/2}}\\
&=\frac{Q}{4\pi\epsilon _ 0r^2}\frac{1-\beta^2}{(1-\beta^2\sin^2\theta)^{3/2}}.
\end{aligned}
其中\beta=v/c\theta为点与x轴夹角。由此可知,平行于电荷运动方向的电场是最弱的,垂直电荷运动方向的电场是最强的(等于静电荷的电场)。同时,\boldsymbol E不再像静电场一样是个保守场:切向曲线积分是0,径向曲线积分的值与\theta有关。


我们现在考虑运动电荷对运动电荷的作用。

假设有一条无限长导线沿x向放置。里面正电荷和负电荷的线密度大小均为\lambda,而正电荷相对当前的参照系F静止,负电荷则以速度v _ 0x正向移动,从而导线中形成电流,但是导线呈电中性。由Gauss定律,导线外电场为0,测试电荷q静止在外时受到0电场力。现在让q以速度vx向运动,并考虑q静止的参照系F'。此时导线的正电荷的密度扩大为\gamma\lambda,问题在于计算负电荷的密度。

由速度变换式,在F'负电荷的速度为v' _ -=(v _ 0-v)\mathbin/(1-v _ 0v/c^2),从而\gamma _ -'=1\mathbin/\sqrt{1-v _ -^{'2}/c^2}。在F参照系负电荷的密度为-\lambda,那么在负电荷静止的参照系F^-下负电荷密度为-\lambda/\gamma _ 0,从而得知在F'参照系下负电荷密度为-\lambda\gamma _ -'/\gamma _ 0,进行计算:
\begin{aligned}\gamma _ -'&=\frac{1}{\sqrt{1-(\beta _ 0-\beta)^2/(1-\beta _ 0\beta)^2}}=\frac{1-\beta _ 0\beta}{\sqrt{(1-\beta _ 0\beta)^2-(\beta _ 0-\beta)^2}}
\\&=\frac{1-\beta _ 0\beta}{\sqrt{1+\beta _ 0^2\beta^2-\beta _ 0^2-\beta^2}}=\frac{1-\beta _ 0\beta}{\sqrt{(1-\beta _ 0^2)(1-\beta^2)}}=\gamma _ 0\gamma(1-\beta _ 0\beta).
\end{aligned}
从而
-\lambda\gamma' _ -/\gamma _ 0=-\lambda\gamma(1-\beta _ 0\beta).F'参照系下电荷密度为
\gamma\lambda-\lambda\gamma(1-\beta _ 0\beta)=\gamma\lambda\beta _ 0\beta.这表明导线带正电。由Gauss定律,有E'\cdot2\pi r'l'=\gamma\lambda\beta _ 0\beta\cdot l'/\epsilon _ 0,从而
E'=\frac{\gamma\lambda\beta _ 0\beta}{2\pi r'\epsilon _ 0},\quad qE'=\frac{q\gamma\lambda\beta _ 0\beta}{2\pi r'\epsilon _ 0}.
我们要将F'中的电场力变回F中的力。

注意到前面在计算\gamma _ -'的过程中,实际上我们证明了这样的结论:设参照系相对速度为u,速度为\boldsymbol v=(v _ x,v _ y)的物体,在沿x正向运动的参照系中变换为\boldsymbol v'=(v _ x',v _ y')。那么,有\gamma _ {v'}=\gamma _ u\gamma _ v(1-v _ xu/c^2)

从这个结论,我们可以看到:
p _ y'=\gamma _ {v'}m _ 0v _ y'=\gamma _ u\gamma _ v(1-v _ xu/c^2)\cdot m _ 0v _ y'=\gamma _ vm _ 0v _ y=p _ y.y向动量不变。现在假设\boldsymbol v=\boldsymbol 0,如果有一个y向力F _ y作用\Delta t时间,动量变化\Delta p=F _ y\Delta t,而\Delta t'=\gamma\Delta t,那么\mathrm d p' _ y/\mathrm dt'=1/\gamma\cdot\mathrm d p _ y/\mathrm d t=F _ y/\gamma,即F _ y'=F _ y/\gamma

现在回到F参照系,测试电荷qx向不受力,受到的y向力应是在它静止的F'系的力qE'1/\gamma,又注意到\lambda _ 0\beta _ 0c恰好为导线的电流I,于是
F _ y=\frac{qvI}{2\pi r\epsilon _ 0c^2}.另一方面,当电荷垂直导线运动时,可以推导,电荷受到的力平行导线方向,大小不变。这表明,可以定义磁场\boldsymbol B,大小为
B=I/(2\pi r\epsilon _ 0c^2)\implies F=qvB.一般地,电荷q在电场\boldsymbol E,\boldsymbol B中受到的力为\boldsymbol F=q(\boldsymbol E+\boldsymbol v\times\boldsymbol B),称为Lorentz力。

电磁场的转换

下面来看不同惯性系间电磁场的转换关系。

:考虑一个无限大平面,垂直y轴平行xz平面放置,并有x向的速度v_0。设面电荷密度为\sigma,面电流密度为K,则单位时间电流为Kl=\sigma v _ 0lK=\sigma v _ 0。由对称性,平面产生的磁场平行z轴,那么由Ampere定律,Bl-(-Bl)=\mu _ 0KlB=\mu _ 0\sigma v _ 0/2。再考虑在平面附近放一个一样的异电平面,叠加之后,只有平面之间有磁场B _ z=\mu _ 0\sigma v _ 0,平面之外无磁场。由Gauss定律,只在平面之间有x向电场,大小为E _ x=\sigma/\epsilon _ 0

现考虑沿x向以速度v运动的参照系F',考察电场磁场的变化。

F'下,平面电荷的速度为v _ 0'=(v _ 0-v)/(1-v _ 0v/c^2),电荷密度变为\sigma\gamma _ 0'/\gamma _ 0(因为电荷静止的参照系中,电荷密度为\sigma/\gamma _ 0,这个参照系与F'的相对速度为v _ 0')。利用前面的结论:\gamma _ 0'=\gamma _ 0\gamma(1-\beta _ 0\beta),于是:F'下电荷密度为\sigma\gamma(1-\beta _ 0\beta)。从而面电流密度变为K'=\sigma'v _ 0'=\sigma\gamma(v _ 0-v)

这样就可以计算新的电场和磁场了:(注意到\mu _ 0\epsilon _ 0=1/c^2
\begin{aligned}
E _ y'&=\sigma'/\epsilon _ 0=\frac{\sigma\gamma}{\epsilon _ 0}\Big(1-\frac{v _ 0v}{c^2}\Big)=\gamma({\sigma}/{\epsilon _ 0}-v\cdot\mu _ 0v\sigma)=\gamma(E _ y-vB _ z) ,\\
B _ z'&=\mu _ 0K'=\mu _ 0\sigma\gamma(v _ 0-v)=\gamma\Big(\mu _ 0\sigma v _ 0-\frac{\sigma v}{c^2\epsilon _ 0}\Big)=\gamma(B _ z-(v/c^2)E _ y).
\end{aligned}
这正是Lorentz变换让E _ y\to xB _ z\to t的形式!

同理可得E _ z',B _ y'的变换式(注意由于\boldsymbol B的方向定义,式子的符号或会改变)。

:考虑一个无限长线圈,单位长度匝数为n,轴沿x向放置,现在通电I,则内部产生x向磁场,大小为:B _ x=\mu _ 0nI。让参照系F'沿x向匀速运动,那么n由于尺缩效应变为\gamma倍,I由于钟慢效应变为原来的1/\gamma,综合效果为B _ x保持不变:B _ x'=B _ x


在前面的例子中我们已经看到了E _ x'=E _ x,总结起来就得到了全套\boldsymbol E,\boldsymbol B的变换。这是个具有一般性的变换。

电磁场变换:设F'以速度v沿Fx正向运动,那么
\begin{aligned}
E' _ x&=E _ x,&B _ x'&=B _ x,\\
E _ y'&=\gamma(E _ y-vB _ z),&B _ y'&=\gamma(B _ y+(v/c^2)E _ z) ,\\
E _ z'&=\gamma(E _ z+vB _ y),&B _ z'&=\gamma(B _ z-(v/c^2)E _ y).
\end{aligned}


评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注