Home | News | Magazine | Library | Encyclopedia | Review | Essay | Forum
2002
返回首页
所在的位置:三思→三思小百科→物理科学

物理


狭义相对论素描


作者 space1 (排骨教主)


(1)


  以前提到过民间物理学家的问题,他们被定义为未经严格训练,满足于用初等推导来讨论物理学重大基本原理的科学爱好者。这些人是真热爱物理学,投入的时间精力也远大于所谓职业物理学家,而且甘于贫困。我个人非常尊重他们这些优点,这也是为什么一直致力在bbs上花时间回答他们问题的原因。

  但是这些民间物理学家的另外一个特点就是:他们从来不了解他们所讨论问题的全貌。这样他们和专业人员的讨论变得异常困难,而且直接导致专业人员不愿意看他们相对贫乏的推导。

  我个人非常不理解的是,他们既然可以化如此多时间精力在这里,智力一般也很高,为什么不愿意踏实的全面掌握自己要讨论的东西,多学一些数学呢?也许一开始看到专业理论所需要的深厚基础就使他们不敢踏出这第一步。抛开他们的热情和努力,这也算得是一种好高务远。

  再有,即便是理科生,出基础理论物理和自己对相对论有特殊兴趣的人,一般说来也就满足于承认原理之后的推导,不太管理论原理的实验基础以及当初为什么要被迫提出这些原理来。

  这几篇文章将专门讨论狭义相对论,为这方向的民间物理学家指出如下几点:

  1、狭义相对论只有两个基础假设。

  1-1、所有惯性系对描述物理规律都是等价的;
  1-2、光速独立于光源。

  其它比如光速最高等等都不是假设,而是结果。这两个基本原理各自有自己的实验基础。

  1-1在电动力学建立之前是很自然的。它是两个东西的数学自然结果:a)。运动学上的Galilean相对性。Galilean变换是先验的,而且几乎就是彻底自然,容易接受的。关于坐标的变化那没有可说的,直接就是矢量运算的定义。

  但是这里面有一个隐含假设:只有时间在两个系统中是一样的,那矢量运算的定义才能用来退出Galilean变换;但是时间作为独立于空间的量,这是所有人的自然感觉,不会有任何神经病企图在这里责备这原理。b)。在这如此自然的Galilean相对性之下,讨论Newton力学,发现力是独立于参考系坐标变换的;这意味着两个惯性系里面的力学规律完全等价。这结论又天衣无缝的符合了人们的实践经验。提醒注意一下:

  倘若Newton力学刚好不独立于Galilean变化,那人们首先要责难的保证是Newton力学,而不是相对性。我强调这点,是要说明为什么狭义相对论在思想上的突破是多么不容易;另外一方面也是指出,若非被现实逼到无路可走,是不会出现这理论的。当然也许数学家作数学游戏倒有可能作出来。

  2、关于狭义相对论的实验。

  基本上所有民间物理学家都在企图通过批判19世纪末期对相对论出现起重大影响的实验来否定相对论。这里我要不客气的指出,这是完全错误的。尤其是Michelson-Morley(1887)的实验,虽然在历史上占有重要地位,但是这其实是个无物理意义的实验。这原因涉及ExtinctiontheoremofEwald(1912)andOseen(1915)。

  提醒那些在打算由这实验入手的民间物理学家注意这点。关于光速的假设,真正算得上决定性的新实验是60年代才做出来的。要想了解这些新实验,要求具备远超科普水平的物理数学知识,这是我强调不理解相关知识就开始讨论基本问题的危害性之处。这里列出一个实验的reference:

  T.Alvager,J.M.Baileyetal,Phys. Lett.,Vol.12,260(1964)

  另外,要想理解Extinctiontheorem,需要深厚的电动力学基础。

  3、关于Lorentz变换。

  Lorentz变换的推导也是民间物理学家要推翻的。这里强调,科普级别的推导极大的忽略了数学严格性,所以给了初学者自由想象的空间。我在后面文章会详细谈这个问题。

  4、总结:

  两个相对论基本假设,是由于电动力学波动方程(要理解这点,你又得学几年物理了)在Galilean变换下不协变引起了困难。这困难要在物理上消除,必须为电磁波假设某种神秘介质,同时假设Maxwell方程组只在这介质上的参考系才成立。

  这样我们就得到一个区别于所有其它惯性系的绝对参考系。在这思路下,就要寻找这神秘介质存在的证据,所有相关实验都失败了。60年代的新实验,用到Mossbauer效应(所以你只好又得读几年物理),可以以极高精度测量地球和这神秘介质,假如它存在的话,之间的相对运动,还是失败。

  既然出现了这样的局面(即电磁学定律和Galilean相对性无法共同正确),就只给出两个可能性:

  a)、Maxwell方程组错误;
  b)、该有更普遍的相对性,使Maxwell方程组协变。

  Maxwell如果你学过物理,就知道它是物理学中最漂亮,最基于实验的理论。Maxwell方程组共四个方程,每个对应一个电磁学实验定律,比如欧姆定律,库仑定律,等等。而且经受无穷实验考查,有无穷多应用,错误可能性极小。这四个方程三个是实验的直接归纳,另外一个是实验直接归纳后发现数学上和另外三个不兼容,Maxwell加进一个位移电流的概念后保证数学兼容,而且依然满足实验。要抛弃这个理论是困难的,所以Einstein选择了b)。我看过的民间讨论,知道这些的没有几个,原因他们的相对论知识来自于科普,无法讨论这些深奥的物理学问题。

  另外,满足a),b)惯性系变换叫做Lorentz变换。这变换的严格数学理论,不是科普上那个。有兴趣的话,先学线性代数,然后学点群论,才有资格来评论这个变换。此处我简单声明,它是绝对没有疑点的,千万不要浪费时间精力在这里。

  最后,剩下的事情全是数学了。能评论相对论的地方只有三处:

  1、两个原理对应的实验。你需要阅读所有的著名实验,以及它们的问题。尤其要读60年代的决定性实验。为此你需要极其深厚的物理知识。

  2、Galilean相对性为什么必须抛弃。

  关于这个,你需要更可怕的知识,数学物理都强才行。起码电动力学和波动方程要懂。提醒一下的是,历史上严肃的物理学家很多作过这方面的尝试,连Maxwell定律都有改的,最后被实验否定。

  3、Lorentz变换。

  这是民间物理学家最有可能讨论的部分,仅需半年时间(假设具有高三水平)可以学通。为什么不试试这个呢?然后就知道你的问题在何处了。

(2)


  这篇专门谈Lorentz变换,因为它是所有内容里最简单的。由于涉及线性代数运算,有些地方就直接给结论了。Lorentz变换的推导需要狭义相对论的两个基本假设。光速独立于源和参考系这一条件,将给出时空的联系。正是这一原理,使得时间和空间首次出现了联系。并且这一原理,将直接给出这时--空的度规结构。度规是几何结构的内蕴量,是最重要的。但是我们下面的推导将不用这些抽象概念,直接用线性代数。

  相对论另外一个基本假设就是物理规律在惯性系等价。这一假设蕴涵一个重要对称性,而这对称性将保证满足光速独立不变原理的变换是线性变换。也就是说,Lorentz变换必然是线性的。读到这里,相信你可以回想起来,科普级别的推导,线性形式是作为假设,或者以"为方便记"这样的借口引进的。

  Part A. Lorentz时空。

  光速独立性导致时间空间不独立,以后以时空这词表示。设两个惯性系K,K'。K中坐标X=(x1,x2,x3,x4)(x4=ict),K'坐标X'=(x1',x2',x3',x4')(x4'=ict')。

  i=Sqrt[-1],为方便引进的。

  K'在K中速度为V。设t=0两坐标系原点重合,并且这时位于元点设一点光源发光。由光速独立原理,我们在两个坐标系中都将观察到一个球面波的传播。其波前以光速c沿径向传播。传播距离平方R=(ct)^2=x1^2+x2^2+x3^2 in K and R'=(ct')^2=x1'^2+x2'^2+x3'^2。所以有:

  x1^2+x2^2+x3^2-c^2t^2=0
  x1'^2+x2'^2+x3'^2-c^2t'^2=0      (1)

  这样就知道:

  x1^2+x2^2+x3^2-c^2t^2=p(V)*(x1'^2+x2'^2+x3'^2-c^2t'^2

  其中p(v)=>0是一个可能和速度有关的量,表示由于相对运动引起的可能度规变化。但是由于K,K'两系统对称性,我们必然有p(V)^2=1=>p(v)=1,这样我们就知道K,K'的时空是等度规的。度规相同表示一切几何内蕴量一致。

  x1^2+x2^2+x3^2-c^2t^2=x1'^2+x2'^2+x3'^2-c^2t'^2

  用内积(就是矢量点乘运算)表示就是:

  <X,X>=<X',X'>     (2)

  注意,(2)是光速独立及不变性的直接严格结果(再提醒一下,相对论两个基本假设直接来源于波动方程的Galilean不协变性,从而引起电动力学困难,最后导致ether假设,激发早期(被证明有严重问题)实验探求,终于引发革命这个历史。严格实验是60年代作的)。

  普遍的相对性原理就是,寻求坐标变换:

  X=F(X';V)         (3)

  使度规不变性(2)得以满足。F是一个矢量函数,V是个参数表示K'在K的速度。我们讨论一下它的性质。

  由于相对论惯性系等价的假设,变换F必然有唯一的逆变换G:

  X'=G(X;V)         (4)

  同时这等价性蕴含下述对称性:

  G(X;V)=F(X,-V)      (5)

  (4),(5)是很强的条件,它们限制F必然是线性变换,(5)同时也为这线性变换作了更强限制。线性变换可以用矩阵表示

  X'=A(V)XX=A(V)^{-1}X'    (6)

  A(V)^{-1}表示依赖于速度的逆矩阵。A(V)是四阶矩阵,有16个元素需要确定。

  由下列条件:

  <X,X>=<X',X'>;X'=A(V)X;X=A(V)^{-1}X'及线性代数运算可以证明,A(V)是列正交,行正交的矩阵,这就有12个方程,所以还差四个参数待定。

  再考虑K,K'关系:

  Forx1'=x2'=x3'=0,X的坐标部分位置是Vt。这时三个条件,但是同时带进来矩阵A(V)外的元素t和t'。所以现在这三个条件其实只相当于一个,我们还剩三个元素待定;

  Forx1=x2=x3=0,X'的坐标部分为-Vt'。这有是三个条件。这样我们终于唯一确定了矩阵A(V)。

  以上便是Lorentz变换的推导。对特殊情况,选K,K'某坐标重合,另外两坐标平行,就可以得到简单变换关系,通常科普书上的就是。

  如果再形式化,并且深刻一些,应该讨论Lorentz群。它是O(3,1)群。


(3-1)

  电动力学背景

  狭义相对论的直接思想背景在于电动力学规律的经典协变不成立,导致绝对参照系的存在,而探寻这参考系的努力均失败之上。后来为狭义相对论所作的实验,很多又基于电动力学原理。了解这些实验就必须熟悉电动力学。另外,50年代前大部分实验是无物理意义的,比如迈氏实验。其原因也是电动力学的原因。所以无论想了解狭义相对论的发生基础,还是想了解相对论的现代实验,以及了解为什么50年代前的大部分实验无意义,都得懂电动力学。

  本节因此用来介绍电动力学。由于电动力学涉及非常复杂的数学,所以很多地方只能给结论,无法作推导。希望写完后能使相对论爱好者至少知道相对论的这最大的发生基础。

  首先介绍电动力学的实验背景;然后介绍实验的数学归纳(Maxwell方程组);再介绍Maxwell方程组在经典相对性下的矛盾;其后介绍Lorentz变换下的协变性。内容太多,大概得分子节来写。

  电磁学基本实验定律:

  1、Coulomb'sLaw

  这个是实验法则:两个点电荷(q,q')间的相互作用力为强度随距离平方成反比,于电荷电量乘积正比,方向在电荷连线上,同性相排斥,异性相吸引。

  这个大家如此熟悉的陈述,经历非常复杂的推导后,可以化成微分等价形式,称为高斯定理,构成Maxwell方程组的一个方程:

  div[E(X)]=p(X)/e0(1)

  div[.]表示散度算子,定义为:

  div[E]=Sum[D[E_{i}(X),X_{i}],{i,1,3}]

  E_{i}是电场坐标投影;X_{i}是位置坐标分量;D是求导运算。

  p(X)是X处带电体电荷密度。位置X处电场E(X)定义为该点单位正电荷受的力。

  2、Ampere's Law。

  安培定律也是大家中学就接触的。这个定律是根据测量一个电流对路对附近另外一个电流回大家知道电流在周围将造成磁场,所以这实验其实测量的是磁相互作用。而且这个测量也就是磁感应强度B的理论定义。可惜这结果不象静电力那样容易用嘴描述,因为它涉及回路积分。对长导线来说,电线周围的磁场就遵从中学的所谓右手大拇指法则:

  磁场方向是绕电流方向的圆切线,而其强度正比于电流强度,反比于轴向距离。

  同样经历非常复杂的数学运算后,我们同样得到一个等价微分形式:

  curl[B(X)]=u0*J(X)(2)

  curl是场旋度微分算子,J(X)是X处的电流密度,表示X处单位时间通过单位横截面的电荷,是矢量;u0是比例常数。

  curl的形式比较复杂,不方便在BBS上用文本方式表达;用张量表示的话又怕大部分人都不明白,只好就写到这了。

  另外,从Coulomb's LAW还可以直接得到E(X)的旋度为零:

  curl[E(X)]=0(3)

  从Ampere'sLaw得到B(X)的散度为零:

  div[B(X)]=0(4)

  (1),(2)是两个实验归纳;(3),(4)是两个性质。性质三表明可以把电场表达为一个标量的梯度,从而极大化简数学复杂度:

  (3)=>E(X)=-Grad[v(X)](5)

  v(X)是标量函数,叫电势。Grad是梯度微分算子。

  性质(4)表示B(X)可以表达为另外一个矢量的旋度:

  (4)=>B(X)=curl[A(X)](6)

  A(X)称为矢量势。

  {(1),(5)}=>L[v(X)]=-p(X)/e0(7){(2),(6)}=>L[A[X]]=-uoJ(X)(8)

  L是Laplace微分算子。{(7),(8)}就是电势和矢量势的微分方程。解出它们来,稳恒电磁场就确定了。

  以上原则上稳恒电磁现象全部理论就完了。整个部分不含时间在里面,所以叫稳恒。但是,电磁现象的另外一个重要部分是电磁波的传播,它涉及下面的实验定律:

  3、Faraday's Law。

  这实验也是中学就介绍过的:磁场中放一闭合电路,让磁场变化起来,结果方向电路中出现电流。结论就是磁场的变化造成电动势。定量的说,就是这感应电动势负正比于磁通变化率(磁通是B(X)的面积分)。但是电动势本身是电场E的回路积分,这样就有关系:

  Integrate[<E,dl>,回路]=-D[phi,t]phi=Integrate[<B,ds>,回路所围面积]

  Integrate是积分算子,<.,.>是矢量内积算子,D是微分算子。上面是Faraday'sLaw的积分形式的数学描述。

  如果这电路是静止的,则通过比较直接的计算可的微分关系:

  curl[E]=-D[B,t]      (9)

  这样就看出磁场的变化将改变电场。静电场的性质三此时被(9)取代。

  如果回路相对于我们的坐标系有相对速度V,则通过剧复杂数学推导可同样得到微分关系(9)。这是非常重要的,它说明Faraday'sLaw是满足经典相对性的!

  还有一个电荷数守恒条件,也是电流的连续性条件:

  div[J(X,t)]+D[p(X,t),t]=0    (10)

  到目前为止,真空中的实验规律已经被总结完了。在均匀线性介质中的电磁学规律经过进一步推导可得下述更普遍规律:

  div[D(X,t)]=pf(X,t)     (11)
  div[B(X,t)]=0        (12)
  curl[E(X,t)]=-D[B(X,t),t]  (13)
  curl[H(X,t)]=Jf[X,t]     (14)

  其中:

  D(X,t)=e0*E(X,t)+P(X,t)(P是介质极化强度)  (15)

  称电位移矢量。

  H(X,t)=(B(X,t)/v)-M(M是介质磁化强度)  (16)

  称磁场强度。

  pf是自由电荷,区别于极化电荷等束缚电荷;Jf同理是自由电流。

  但是(14)是明显数学不对的,因为它导致div[curl[H]]!=0,这是数学错误的。其原因在于这些实验总结的规律发生了冲突。Maxwell改写(14)为:

  curl[H(X,t)]=Jf[X,t]+D[D(X,t),t]

  于是最后得到:

  div[D(X,t)]=pf(X,t)     (17)
  div[B(X,t)]=0        (18)
  curl[E(X,t)]=-D[B(X,t),t]  (19)
  curl[H(X,t)]=Jf[X,t]+D[D(X,t),t]  (20)

  这就是著名的Maxwell方程组。我文章前面说法有错误,实际它们是三个实验的归纳,不是四个。一开始我多记了焦耳发热定律,sorry。

  可以说,电磁学全部建立在(17,18,19,20)这些方程上面。它们就是电磁场的物理规律,完全是实验归纳。按一贯的经验,这些规律该是不依赖于惯性系选择的。可是事情将大出你的预料:结果表明,它们将对惯性系的选择不独立。下节再谈这部分。

  另外,周四有考试,偶可能得周四后在续写。


(3-2)

  下面是一些数学变换,使上述共8个方程得到约化。因为计算复杂,我直接给约化逻辑:

  (18)=>存在矢量势A使:

  B(X,t)=curl[A(X,t)]      (21)

  {(21),(19)}=>存在标量势v(X,t)使:

  E(X,t)+D[A(X,t),t]=-grad[v(X,t)]    (22)

  {17,20,21,22}可以得到非常复杂的相互耦合的关于{v(X,t),A(X,t)}的方程组,共四个偏微分方程;根据Helmholtz定理,A还有一个规范自由度,i.e.,我们可以按需要规定div[A(X,t)]而不影响物理结果。通常采用的规范是Lorentz规范,这时候关于v(X,t)的方程和关于A(X,t)方程将不在互相耦合,可以独立求解。如果电磁波传播的媒介是非导体线性均匀介质,那么它们的方程就变成经典波动方程:

  L[v(X,t)]-a*D[v(X,t),{t,2}]=-pf(X,t)/e0;   (23)
  L[A(X,t)]-a*D[A(X,t),{t,2}]=-u0*Jf(X,t);   (24)

  (23),(24)就是波动方程(实际上是Poissoin方程),a是一个常数,依赖于介质。

  取其中一个分量来研究:

  L[Y(X,t)]-(1/a)^2*D[Y(X,t),{t,2}]=0;     (25)

  令右边为零,表示是在自由空间传播。这波动方程的通解是:

  Y(x,t)=f(x+a*t)+g(x-at)      (26)

  这里用小x表示一维情形,是为简单。表示波沿x轴方向传播。f,g是两个任意光滑函数。

  g(x-at)表示沿x正向传播,f(x+at)表示逆向传播。现考察正向波g(x-at)。

  w=x-at     (27)

  叫作这波的一个相。D[w,t]=0是保相条件=>

  D[x,t]=a    (28)

  所以a就是相速度。

  2、补(群速度)。

  必须指出来的是,这里的速度a是和光传输介质有关系的。电荷相互作用测量总结成库仑定律时引入一个参数e0;电流线路的相互作用总结成安培定律时引入一个比例常数u0;真空里方程(25)里面的a其实是:

  a=(e0*u0)^(-1/2)    (29)

  在介质中,因为介质里的原子会被电场E极化;而同时磁场也会磁化介质;这电场与介质的相互作用直接改变介质里面电荷与电流的分布。对最简单的所谓线性均匀各向同性价值来说,经过复杂运算,可以证明只要把以前一切公式里面的e0和u0换成:

  e=(1+ke)*e0;      (30)
  u=(1+ku)*u0;      (31)

  其中ke>0,ku>0,则以前一切在数学上都是适用的。具体到目前的问题上,就是介质里面的电磁波速度变成;

  v=(e*u)^(-1/2)      (32)

  显然小于真空里的速度。今后把真空里的速度记为:

  c=(e0*u0)^(-1/2)     (33)

  这就是通常所谓光速了。

  另外,(26)是一方程(25)的通解。它表明电磁波波,不管是什么样的波,其速度在真空和线性各向同性均匀介质中都是一样,完全决定于电磁参数{e,u}。

  这样的情况下,电磁波的速度就是就是相速,所谓群速度和相速度在真空和在线性介质中没有任何差别。

  如果你学过傅立叶展开的话,就知道我们的通解可以被三角函数展开。这展开的每一项叫作一个平面波;每个平面波的形式是:

  Exp[i(k*x-w*t)]    (34)

  显然w/k=v是速度。对所有可能的k叠加起来就是我们的通解。由于v是由介质电池参数决定的,所以k和频率w不是互相独立的,它们是个函数:

  w=k*v       (35)

  在不是真空或者均匀线性各向同性的介质中(比如介质是个导体),我们可以得到不同于(25)的电磁波方程。这方程的解也不在有(26)那样的通解形式。但是平面波这样的特解常常是方程的解,并附加条件:

  w=f(k)      (36)

  显然(35)是这里的特例。再用傅立叶展开,里面的每个平面波都具有速度:

  v(k)=w/k     (37)

  由于现在w/k不是常数,所以每个平面波的速度不一样,以至于我们的初始波形会随时间变化。这个变化中的波形的中心位置随时间移动的速度为:

  vg=D[w,k]   (38)

  这就是所谓群速。在真空中或者线性均匀介质中,显然:

  vg=v

  这表示所有分波传播速度一样,波形不会改变。

  相对论的问题里面,速度是个大概念。我们这里引进两个速度概念,将来都要重新提到。这里只能笼统说:相对论有关光速的原理是电动力学协变性的需要。而我前面讲如此多的电动力学,是想让大家对电动力学的坚实基础有个印象。可以说它的原理直接是实验归纳---除位移电流外,它是实验的忠实归纳。但是最后会发现如此忠实于实验的理论和经典相对性有冲突。这才是光速原理的来源。至于什么科普书上神经兮兮的"信息的传播"等等,全是哲学考虑,我不喜欢。光速原理有一个必要原因,就是电动力学协变性,希望大家记住这点。我慢慢会把这些都写到bbs上,但是后面数学越来越多,我自己也越来越怀疑自己正在做的事情的意义了。

  已经写这样多,不想半途结束。今后没人看,我自己当复习吧。


(4)介质中电磁波速度;相速,群速

  Maxwell方程组;介质划分;相速度;群速度。

  在这节以前,讲得比较散。好在前面几节已经至少达到一个目的:告诉了电磁场规律是如何从实验总结而来。今后的讨论,直接从Maxwell方程组开始。为这目的,以比较紧凑的形式从Maxwell方程组开始,定义不同介质;定义两个速度:相速度和群速度;详细讨论群速度;证明任何介质中电磁波速度小于真空中电磁波速度(所谓光速)。

  等这一切准备好以后,就可以讨论电磁学方程组的协变问题,然后自然指出SPR的光速独立原理的必然性。

  关于群速度问题,Jackson里面有一节讲这个,非常精采细致。我就按他的讲了。另外,电磁波在任何介质中速度小于光速,也按Jackson的材料讲。

  1、电磁场方程组(Maxwell方程组):

  div[D(X,t)]=pf(X,t)   (1)
  div[B(X,t)]=0      (2)
  curl[E(X,t)]=-D[B(X,t),t]  (3)
  curl[H(X,t)]=Jf[X,t]+D[D(X,t),t](4)

  其中D叫作电位移矢量,定义为:

  D=e0*E+P    (5)

  e0是库仑定律中引入的比例常数;E是电场;P代表介质中的原子分子等受电场极化产生的偶极距密度。既然P由E引起,可写为:

  P=G1(E)     (6)

  G1是某种矢量函数,由介质特性决定。于是得知D也唯一被电场E决定。

  (4)中的H叫做磁场强度,定义为:

  H=(B/u0)-M   (7)

  u0是安培定律中引入的比例常数;B是磁感应强度;M表示由于受磁场作用而引起介质的磁偶极距:

  M=G2(B)    (8)

  G2是某种矢量函数,由介质特性决定。于是得知H也唯一被磁场B决定。

  方程组(1)-(4)是完备的电磁学方程组,适合于任何介质。我们的目标是解E,B。把(5)-(8)带进(1)-(4),就得到关于E,B的非常复杂的方程组,并且依赖于具体介质对电磁场的感应方式G1和G2。

  2、根据G1和G2划分介质类型。

  2-1、均匀线性各向同性介质。

  线性表示P的任何分量是E的分量的线性组合(同理M是B的线性组合),也即P可以表达为一个矩阵作用在E上:

  P=A.E

  A还可能是位置的函数,表示介质不同部分性质可能不同。均匀性表示介质性质处处相同,A不依赖于位置,A是常数矩阵。各向同性要求A是平行于E:

  P=e0*xe*E    (9)

  同理有:

  M=xm/((1+xm)*u0)  (10)

  xe和xm是为方便定义的两个常数,它们和e0,u0一起给出了P,M依赖于电磁场的比例常数。对一切介质,xe>0;但是xm可正可负(顺磁介质/逆磁介质)。

  显然在这种介质下,

  D=(1+xe)*e0*E=ke*e0*E=e*E(11)B=(1+xm)*u0*B=km*u0*B=u*B(12)

  {e,u},或者{ke,km},或者{xe,xm}就代表了介质特性,我把他们叫做介质的电磁参数。

  另外,我们定义一个量:

  n=(ke*km)^(1/2)   (13)

  这叫介质折射率。

  2-2、一点儿推广。

  上面的均匀线性各向同性介质明显要求过分苛刻:它要求介质对任何电磁波的响应必须一样。比如对红光和蓝光的响应必须一样。实际上从三棱镜可以分光这一事实就知道,最理想的现实介质,响应方式其实和电磁波频率有关。所以上面的均匀线性各向同性介质的电磁参数其实是频率的函数。

  3。均匀线性介质中的Maxwell方程组。

  把以上讨论带进(1)-(4),有:

  div[E(X,t)]=pf(X,t)/e   (14)
  div[B(X,t)]=0      (15)
  curl[E(X,t)]=-D[B(X,t),t]  (16)
  curl[B(X,t)]=u*Jf[X,t]+u*e*D[E,t](17)

  这里已经忽略掉介质是导体的情形。

  {14,15,16,17}可以得到非常复杂的相互耦合的关于{v(X,t),A(X,t)}的方程组,

  共四个偏微分方程;根据Helmholtz定理,A还有一个规范自由度,i.e.,我们可以按需要规定div[A(X,t)]而不影响物理结果。通常采用的规范是Lorentz规范,这时候关于v(X,t)的方程和关于A(X,t)方程将不再互相耦合,可以独立求解。如果电磁波传播的媒介是非导体线性均匀介质,那么它们的方程就变成经典波动方程:

  L[v(X,t)]-u*e*D[v(X,t),{t,2}]=-pf(X,t)/e;  (18)
  L[A(X,t)]-u*e*D[A(X,t),{t,2}]=-u*Jf(X,t);(19)

  {注:在{e,u}随频率相关明显的介质,以上方程只对特定频率满足}

  E和B可一如下得到:

  E=-grad[v]-D[A,t]  (20)
  B=curl[A]     (21)

  (18),(19)就是波动方程(实际上是Poissoin方程),

  重要评注:(18),(19)的推导利用了Lorentz规范条件;记住我们还有一个自然的电流连续性条件。考虑到这二者之后,并考虑(20),(21),则(18),(19)完全等价于(14)-(17)。也就是说,电磁场规律完全由(18),(19)决定。讨论Maxwell方程组的协变性,也就等价于讨论(18),(19)两个偏微分方程的协变性。

  取其中一个分量来研究:

  L[Y(X,t)]-u*e*D[Y(X,t),{t,2}]=0;   (22)

  令右边为零,表示是在自由空间传播。这波动方程的通解是:

  Y(x,t)=f(x+a*t)+g(x-at)    (23)

  a=(u*e)^(-1/2)       (24)

  这里用小x表示一维情形,是为简单。表示波沿x轴方向传播。f,g是两个任意光滑函数。

  g(x-at)表示沿x正向传播,f(x+at)表示逆向传播。现考察正向波g(x-at)。

  w=x-at       (25)

  叫作这波的一个相。D[w,t]=0是保相条件=>

  D[x,t]=a      (26)

  所以a就是相速度。

  真空中速度为:

  c=(e0*u0)^(-1/2)      (27)

  介质中速度为:

  v=(u*e)^(-1/2)=c/n     (28)

  n是折射率。

  如果介质电磁参数明显依赖于频率,(28)意味着不同频率的电磁波在介质中速度不一样。

  4、群速度定义。

  如前所述,介质中电磁波速度为:

  a=c/n

  而如前所述,n一般说来是电磁波频率的函数,导致不同频率电磁波在介质中跑的不一样快。

  另外,就我们的均匀线性介质而言,可以证明

  Exp[i(k*x-w*t)]    (29)

  总是Maxwell方程的一个特解,providedarelationbetweenkandw:

  w=g(k)

  显然w/k=a=(u*e)^(-1/2)=c/n是速度。由于现在电磁参数是频率w的函数,所以w/k=v(w),是某一特定频率电磁波的(相)速度。

  如果v不是w的函数,那它是一个完全决定于介质的常数。任何频率的电磁波穿越这介质时速度一样。

  对所有可能的k叠加起来就是我们的通解。由于v是由介质电磁参数决定的,所以k和频率w不是互相独立的,它们是个函数:

  由于每个平面波的速度一般说来不一样,以至于我们的初始波形会随时间变化。

  这个变化中的波形的中心位置随时间移动的速度为:

  vg=D[w,k]   (30)

  这就是所谓群速。在真空中或者与频率无关线性均匀介质中,显然:

  vg=v

  这表示所有分波传播速度一样,波形不会改变。

  我们下面一节要专门讲群速度的意义。另外,在前面贴的和这里差不多内容的(3-2),讲得不清楚,所以看这里的可能好些。


(4)群速;电磁波速度极限

  上节说道任何介质中平面波Exp[i(kx-wt)]总是Maxwell方程组的特解,并伴随条件:

  w=g(k)    (1)

  显然w/k=a=(u*e)^(-1/2)=c/n是速度。由于现在电磁参数是频率w的函数,所以w/k=v(w),是某一特定频率电磁波的(相)速度。

  (1)叫做色散关系,其来源是因为不同频率(颜色)平面波在介质中速度不一样。k为正表示沿x正向传播;为负表示反向传播。但是介质均匀,不可能判断波方向,所以有:

  g(k)=g(-k)    (2)

  对所有可能的k叠加起来就是我们的通解(其实就是傅立叶变换)。

  由于每个平面波的速度一般说来不一样,以至于我们的初始波形会随时间变化。

  这个变化中的波形的中心位置随时间移动的速度为:

  vg=D[w,k]   (3)

  这就是所谓群速。在真空中或者线性均匀介质中,显然:

  vg=v

  这表示所有分波传播速度一样,波形不会改变。

  我们这一节要专门讲群速度,取材于Jackson电动力学。

  不同频率平面波叠加(傅立叶变换)得到波动方程通解为:

  y(x,t)=1/Sqrt(2*Pi)*Integrate[a(k)Exp[ikx-iw(k)t],{k,-Inf,+Inf}]  (4)

  a(k)=1/Sqrt(2*Pi)*Integrate[(y(x,0)+i/w(k)D[y,t=0])Exp[-ikx],{x,-Inf,+Inf}]  (5)

  反变换(5)解释一下:因为波动方程是二阶方程,所以需要两个初条件y(x,0),D[y,t=0]。(5)里面就包含这俩初条件。所以这里和通常傅立叶积分有点差别,可以看作广义的傅立叶积分。实际上(4)和(5)表示了从初始波形开始的一个演化规律。今后为方便,都假设D[y,t=0]=0,就是大家熟悉的变换了。

  a(k)=1/Sqrt(2*Pi)*Integrate[y(x,0)Exp[-ikx],{x,-Inf,+Inf}]  (6)

  a(k)的含义就是初始波形中k分波的强度(振幅),也表示初始波中频率为w(k)的平面波的强度。a(k)或者写为a(k(w))就是所谓频谱。

  假如初始波形y(x,0)具有定域(dx)特征:

  y(x,0)=0forx<-dx/2orx>dx/2     (7)

  这就是所谓波包。这时候从(6)可以看出a(k)必然有定域dk的特征:

  a(k)=0,fork<dk/2,ork>dk/2     (8)

  比如初始波形直接就是平面波,那y(x,0)是三角函数,随x蔓延无穷,dx=Inf。这时候观察(6),a(k)就是个Delta函数,dk=0。反过来,如果初始波形是个delta函数,dx=0,则(6)表面a(k)的定域dk=Inf。一个普遍的结论就是:

  dx*dk>=1/2      (9)

  (9)很有意思的,量子力学也用到来讲所谓测不准原理,那里把粒子看成一个波包了。

  考虑初始波包,设它具有较长定域dx,这就意味着dk比较小,也就是说如果你画出a(k)图象,a(k)分布在一个尖峰k0附近小范围内。既然如此,就可以把w(k)在k0作台劳展开到一阶:

  w(k)=w(k0)+D[w(k),k-k0](k-k0)   (10)

  这就是说我们的初始波有一系列频率非常接近的平面波叠加而成。把(10)带回(4),经历一系列运算,可以得到:

  y(x,t)=y(x-t*D[w(k),k=k0],0)*Exp[i*f(k0)]    (11)

  

  Exp[i*f(k0)]只是一个相因子,模为一。(11)表明t时刻x处的y是从t=0时刻x-t*D[w(k),k=k0]处的y运动过来的,而且运动速度就是

  vg=D[w(k),k=k0]       (12)

  这样,vg具有波包整体运动速度的含义,所以叫做群速度。今后我们用vp表示相速度:

  vp=w(k)/k=c/n(k)      (13)

  所以vg和vp是完全不一样的。

  我们下面把vg也用折射率表示出来:

  vg=c/[n(w)+w*n'(w)]      (14)

  wheren'(w)=D[n(w),w]。

  n'(w)>0叫做正常色散,对大多数介质适用,这时候明显vg<vp;n'(w)<0称谓反常色散,这时候vg>vp,甚至可以vg>c!但是不要以为这里违反了SPR的光速最大的结论。因为这时候数学上表示w(k)随k变化非常迅速,台劳极数的一阶近似就不适用了。

  要讨论介质中速度的极限问题,首先要讨论e(w)以及n(w)的关系问题。这一问题本世纪初其已经被很好的建立起来,叫做Kramers-KronigRelation,数学非常复杂,不易写在BBS上。我直接列出主要结论:

  设入射电磁波在t=0到达x=0,i。e。,y(0,t)=0,fort<0,这样我们就表示了一个任意入射波;可以证明:

  y(x,t)=Integrate[(2/(1+n(w))*a(w)*Exp[ikx-iwt],w]
  a(w)=1/(2*Pi)*Integrate[u(0,t)Exp[-iwt],x]

  最后利用Kramers-KronigRelation可以证明:

  y(x,t)=0,forx-ct>0

  这就表示任何电磁波传播速度不可能大于c。

  以上就是群速理论的简单介绍以及指出,在经典电动力学的范围内,已经证明,任何介质中的任何电磁波,其传播速度不可能大于真空光速。

  下面一节终于可以讨论波动方程的协变性质乐。

  周末再写。


(5)电磁学规律的Galilean不协变性

  SPR两个原理里面有一个是信念:物理规律不该依赖于惯性系的选择。

  在经典相对性里面,力学规律就是Newton第二定律。它明显是独立于(惯性)坐标系选择的。

  但是现在关于电磁场的物理规律,Maxwell方程组,则被发现如果按照经典相对性,这规律是依赖于坐标系选择的。下面这节就要讲这个问题。

  首先我们还是要回顾Maxwell方程组:

  1、电磁场方程组(Maxwell方程组):

  div[D(X,t)]=pf(X,t)   (1)
  div[B(X,t)]=0    (2)
  curl[E(X,t)]=-D[B(X,t),t]  (3)
  curl[H(X,t)]=Jf[X,t]+D[D(X,t),t]  (4)

  方程组(1)-(4)是完备的电磁学方程组,适合于任何介质。我们的目标是解E,B。把(5)-(8)带进(1)-(4),就得到关于E,B的非常复杂的方程组,并且依赖于具体介质对电磁场的感应方式。

  2、均匀线性介质中的Maxwell方程组。

  把以上讨论带进(1)-(4),有:

  div[E(X,t)]=pf(X,t)/e    (14)
  div[B(X,t)]=0      (15)   curl[E(X,t)]=-D[B(X,t),t](16)  
  curl[B(X,t)]=u*Jf[X,t]+u*e*D[E,t]  (17)

  这里已经忽略掉介质是导体的情形。

  {14,15,16,17}可以得到非常复杂的相互耦合的关于{v(X,t),A(X,t)}的方程组,

  共四个偏微分方程;根据Helmholtz定理,A还有一个规范自由度,i。e。,我们可以按需要规定div[A(X,t)]而不影响物理结果。通常采用的规范是Lorentz规范,这时候关于v(X,t)的方程和关于A(X,t)方程将不在互相耦合,可以独立求解。如果电磁波传播的媒介是非导体线性均匀介质,那么它们的方程就变成经典波动方程:

  L[v(X,t)]-u*e*D[v(X,t),{t,2}]=-pf(X,t)/e;   (18)

  L[A(X,t)]-u*e*D[A(X,t),{t,2}]=-u*Jf(X,t);   (19)

  {注:在{e,u}随频率相关明显的介质,以上方程只对特定频率满足}

  E和B可一如下得到:

  E=-grad[v]-D[A,t]    (20)

  B=curl[A]    (21)

  (18),(19)就是波动方程(实际上是Poissoin方程),

  重要评注:(18),(19)的推导利用了Lorentz规范条件;记住我们还有一个自然的电流连续性条件。考虑到这二者之后,并考虑(20),(21),则(18),(19)完全等价于(14)-(17)。也就是说,电磁场规律完全由(18),(19)决定。讨论Maxwell方程组的协变性,也就等价于讨论(18),(19)两个偏微分方程的协变性,电流连续性条件的协变性,还有Lorentz规范的协变性。

  如果这几个规律同时在坐标变换下协变,则一定保证Maxwell方程组协变。

  我将如下讨论:

  A)首先证明Maxwell方程组在Galilean变换下不协变。

  为此只需要证明上述几个条件任意一个不协变即可。我下面证明波动方程不协变。为简单记,证明真空中的一维波动方程不不协变。真空中一维自由波动方程是:

  (取其中一个分量来研究)

  在我们的实验室参考系K中,

  D[Y(x,t),{x,2}]-u0*e0*D[Y(x,t),{t,2}]=0;   (22)

  D[Y(x,t),{x,2}]是对位置x的二阶导数,同理D[Y(x,t),{t,2}]是对时间t的二阶导数。

  现在考虑运动中的惯性系K',设它的x'轴于K重合,y',z'两轴于K有相同指向;再设K'以速度V沿K的x正向运动。那么Galilean变换为:

  x'=x-v*t,y'=y,z'=z,t'=t     (23)

  现在利用隐函数求导法则求微分算子的变换规律:

  D[Y,{x,1}]=D[Y,{x',1}]*D[x',{x,1}]=D[Y,{x',1}]   (24)

  =>

  D[Y,{x,2}]=D[Y,{x',2}]   (25)

  这表明对位置的微分在galilean变换下协变;现在看对时间的微分:

  D[Y,{t,1}]=-D[Y,{x',1}]*D[x',{t,1}]+D[Y,{t',1}]*D[t',{t,1}]=-V*D[Y,{x',1}]+D[Y,{t',1}]  (26)

  =>

  D[Y,{t,2}]=V^2*D[Y,{x',2}]-2*V*D[Y,{x',1},{t',1}]+D[Y,{t',2}]   (27)

  于是波动方程在Galilean变换下成为:

  D[Y,{x',2}]-(u0*e0-V^(-2))*D[Y,{t',2}]+2*V*D[Y,{x',1},{t',1}]=0   (28)

  (28)表示波动方程不协变!另外,交叉导数项表明,任何只针对空间坐标的变换是不可能导致波动方程的协变的(这个你可以自己按这方法作一下)。任何想使得波动方程协变的坐标变换必须连时间一起变!


(6)光速原理。

  前面几节,除第一,第二篇外,别的全是电动力学介绍。介绍电动力学的必要性是,SPR里面有一个原理涉及光速,而光速是电动力学的概念,所以必须谈它。到目前已经介绍了:

  1、电磁场基本实验及其总结(Maxwell方程组);

  2、(真空)光速:根据Maxwell方程组,真空光速完全由库仑定律和安培定律这俩实验定律中引入的相互作用比例常数(e0,u0)决定:c=Sqrt[e0*u0]^(-1/2);

  3、电磁场方程组是伽利略变换不协变的。

  在第一节还介绍了SPR两个基本原理:

  A、所有惯性系对描述物理规律都是等价的;B。光速独立于光源。

  其中A要求物理规律形式必须保持不变。这个是信念。现在看看B的自然来源:库仑定律和安培定律二者都是电磁场规律。根据A,它们必须在不同惯性系中一致。现在唯一的事情就是要考虑比例常数是否会有不同。这里只是为严格才这样想。否则,根据经典相对性,力的测量值与参考系无关。规律协变,加上力的性质,那么(e0,u0)必定于参考系无关。

  这俩比例常数是参考系无关的——-因为这两实验的测量条件是在一个参考系中的静止测量(电荷静止,电流回路静止)。倘若居然是参考系有关,那就意味着着在一个参考系内对这两常数的测量依赖于这参考系的速度——这速度必然是绝对速度,因为(e0,u0)的测量值就可以规定它。于是这样我们就有了不依赖于相对测量的速度概念,惯性系是有差别的,可以定义绝对静止这个概念。这样对(e0,u0)的测量本身就起了热力学中温度计的作用。我们可以规定"绝对零速度"对应的(e0,u0)值,历史上这个绝对零速度规定为Sqrt[e0*u0]^(-1/2)正好是c的那个参考系(以太)对应的速度。那别的参考系速度如何定呢?----就根据速度定义求对"以太"的相对速度!

  令P=Sqrt[e0*u0]^(-1/2),则我们有函数关系:

  P(v)=P(0)-v

  其中v是某参考系的绝对速度;P(0)=c。

  你看看,这是第一个吃惊结论:库仑定律和安培定律的两个比例常数居然和参考系如此相关。这两测量是力测量,结果会和经典速度相加性有关,你看怪不怪?就算怪到这地步,神秘得简直不可理喻,本世纪初期的物理学家也并没有就此抛弃这可能性。他们反而作了大量实验测量这可能的"以太"的存在性。开始的几个实验有问题,出现零结果可以被解释为另外原因;极严格和极高精度实验是5-60年代作的,还是零结果。这些实验有空我都会在bbs上介绍给大家。目前极高精度的实验不支持这种绝对参考系的存在。

  我们再看,光速由这两定律比例常数决定,根本和光源没关系。

  这样,最后到目前最可靠的suppose就是:光速独立于参考系,独立于光源!

  这也是最自然的结论:否则我们就一定会得到另外一个更不自然的结论:力学测量中的比例常数,竟然组合成函数P后,有伽利略叠加性!

  以上就是我对速度原理的一点儿说明。不清楚电动力学,不可能作这样的说明。

  不学习电动力学,就会觉得速度原理不舒服。建议对SPR有兴趣的人一定先学电动。

  以后主要介绍相对论实验,几个著名佯谬,相对论对Newton力学的影响,等等慢慢来。


Einstein的重大工作list和他的SPR思想来源

  1、第一篇:光电效应。这个工作把光量子化了。在当时具有非常重大的理论。这个工作可以说对量子力学早期思想有很大影响。

  2、分子理论,特别是Brown运动。这个工作的理论和应用意义都非常大。他把统计物理学的扩散系数和流体的粘滞效率联系起来。我们现在讨论Plymer在流体中的性质就要天天用它。这个工作专门出了单行本。

  3、SPR。

  4、GNR。

  5、Eistein量子化条件。这个工作可能知道的人不多。因为这个量子化条件出来时,量子力学基本体系已经建立。他这个量子化条件比索末非尔得的量子化条件自然。这个理论最近才获得广泛应用,---量子混沌的研究里面,如果考虑高阶激发谱,采用这个条件可以得到非常自然的结果。以至于Ott评价,说量子混沌的关键已经隐含在这个久已遗忘的理论之中。

  最后我们看看MartinKlein的评论:

  ……爱因斯坦建立SPR主要是通过对电动力学的思考。而麦氏实验等对他的影响其实不大……

  这里我在本版贴的SPR正是纯粹从Maxwell方程组出发,以便符合爱因斯坦的思路习惯。




本文相关信息:
收录时间:2000.08
作者:排骨教主
来源:转载



该作者其它作品:



其它相关阅读:



相关网站:
首页 | 版权声明 | 本站导航 | 关于本站 | 联系我们 ©1999-2002 www.OurSci.org,All Rights Reserved.