主题词: 混沌, 天体物理
提要
本文简要介绍了混沌理论的一些基本概念, 指出在天体物理系统( 特别是非保守 系统)中出现的混沌行为以及对它们的研究, 并介绍了运用混沌理论研究天体物理问 题的基本思想和常用的分析方法.
引言
自六十年代气象学家Lorenz和天文学家Henon开始对混沌现象进行研究后,近三十 年来对混沌的研究和应用无论是广度还是深度都得到了极大的发展[1].物理学家、数 学家、生物学家和天文学家们创立了一套新的思想: 简单系统产生出复杂行为, 复杂 系统产生出简单行为, 特别是有关复杂性的规律具有普适性, 而与构成系统的组元的 细节完全无关. 这种新的思想正在改变着整个科学建筑的结构, 有人称混沌理论是本 世纪物理学中的第三次革命,而Feigenbaum普适性常数δ是继c、h 后的第三个基本常 数. Wheeler认为: “今天谁不知道高斯分布或熵概念的意义和范围, 谁就不能被认 为是科学上的文化人; 同样可以相信, 明天谁不熟悉分形, 谁也将不能被认为是科学 上的文化人.”
进入八十年代, 天体物理中的混沌开始引起人们越来越多的注意, 尤其近年来在 天体物理刊物中运用混沌理论的文章在不断增加. 天文学家在混沌理论的创建中起了 很大的作用, 将来在混沌理论的发展和应用上也必然会做出其应有的贡献. 本文介绍 了混沌理论的一些基本概念、天体物理中(特别是非保守系统中)的混沌现象以及运用 混沌理论研究天体物理问题所使用的方法, 其目的是希望天文界对这门新的学科给以 理解和重视, 并推动它向前发展. 关于天体物理中(特别是在太阳系中)有关天体力学 问题的混沌运动现象, 南京大学天文系暨非线性研究中心已做了大量的工作, 有兴趣 者可参考有关文献, 本文则不再赘述.
一、混沌理论的基本概念1. 混沌(chaos) 对“混沌”一词目前尚没有被普遍接受的定义. 郝柏林对它的描述是[2]:混沌并 不简单地等同于无序, 更恰当的是把混沌看作一种没有周期性的有序. 在混沌区内可 以看到有序运动的模式在更小的尺度上是由混沌所点缀的, 这已经被数值计算或物理 实验所证明. 与一般的空间或时间上的周期性不同, 混沌通常具有一种尺度不变性, 从而有可能使用重整化群的方法来研究.
2. 倍周期分叉(period doubling bifurcation)与混沌
May在其名为“简单的数学模型具有极其复杂的动力学”的文章中, 表明逻辑斯 蒂方程 Xn+1=rXn(1-Xn) 有着令人惊奇的动力学行为[3]: 当0≤r<3时,X 值在经过几 次振荡后便很快趋向一个固定值, 即Xn+1=Xn, 这时达到了一种定态(一维不动点) ; 而当r稍大于3时, X不再趋向单一数值, 而是趋向于在两个值之间跳跃, 即当n足够大 时Xn+2=Xn, 称为周期2; 当r再增大时, X值便会在4个不同值之间跳跃, 即Xn+4=X n, 称为周期4; …. 在X-r图中(见图1)可看到定态 区的X与r是单值关系, 但r>3时, 开 始出现 分叉, 成为双值关系, 以后随着r的增大, 分叉越来越快,按2、4、8、…、 ┌─────────────┐2k、…分 裂, 最后突然中断, 在一特定的r值以后, │ 图1. 倍周期分叉与混沌 │ 周期性让位于混沌, 这是一种永不落于定态 的 │ │涨落, X值似乎完全是随机的. 但是当r继 续增大 │ │时, 就在混沌区间出现一个具有规则周期的窗口( │ │如周期3), 接着倍周期分叉以更快的速率进行, 很 │ │快地经过3、6、12、…、3·2k、…这些周期, 然 └─────────────┘后再次中断而进入新的混沌.
由逻辑斯蒂方程的动力学性质可以看出: 只要稍微改变某一参数, 同一系统竟然 表现出完全不同的行为模式. 李天岩与Yorke在“周期3意味着混沌”一文中[4], 以 数学的严格性证明在任何一维映射系统中, 只要出现规则的周期3, 同一系统也必然 会给出其它任意长的规则周期以及完全混沌的循环. 这表明简单的决定论模型能产生 出类似于随机的行为, 这种行为实际上是具有精巧的细微结构, 不过它的每一部分看 起来都与噪声不可区分; 也就是说明显的随机性可能来自简单的模型. 这样传统上所 用的艰难的连续微分方程模拟的复杂系统就有可能靠容易的离散模型去理解.
以上便是由倍周期分叉走向混沌的一个范例 . 后来人们又发现了从准周期 (quasiperiodicity)或阵发性(intermittency)走向混沌的动力学模式[5,6].
3. Feigenbaum普适性原理
对一维的迭代方程 Xn+1=f(μ,Xn), 通常可限制如下: a.在X=0处 f达到最大值, 即f'(μ,0)=0, 且取f(μ,0)=1; b.f(μ,X)在X<0时单调增加, 而当X> 0时单调减小. 则f:Xn→Xn+1称为单模(unimodal)映射. Feigenbaum证明[7]: 只要映射 f是单模的, 且在X=0处的邻域可展开为: f(μ,X)=1-μXα+…, 其中α=2,4,6,…, 则对于周期p =2n开始分叉时的μ值(记为μn),在n→∞时存在着关系:
μn≈μ∞── (当n→∞时, C是常数), 其中δ=lim ────── =常数.
这表明倍周期分叉点的参数值的间距是几何收敛的, 意味着其中存在尺度变换的性质. 正是基于此点, Feigenbaum利用重整化群理论建立了非线性普适性理论. 同时也说明, 只要映射f是单模的, 其倍周期分叉的结构便是相同的; 而f在X=0 处的邻域展开式中 的α相同时, 就有相同的常数δ, 故此称δ为普适性常数(当α=2,4,6,8时,δ=4.669, 7.248,9.296,10.048[7,8]). 因此无论原来的方程形式和意义有多么不同, 当有序出 现时便有着相同的结构, 也就意味着不同系统的行为相同. 因此逻辑斯蒂方程虽然是 α=2的特例, 但它的动力学行为模式却是具有普遍意义的.
还有其他一些普适性常数, 例如倍周期分叉的功率谱中两个相邻倍周期的峰值高 度比是13.2db[9], 在μ=μ∞处的混沌吸引子的维数是0.538[10], 等等.
Libchaber在液氦的流体力学不稳定性的实验研究中, 看到了倍周期分叉以及13.2db 的功率谱峰值比[11]. 这就说明Feigenbaum普适性理论不仅对一维映射是成立的, 甚 至象流体这样的复杂系统也遵循相同的规律. 在这里如此的复杂性和如此的简单性就 这样令人惊奇地结合在一起了.
4. 奇怪吸引子(strange attractor)
对动力学的耗散系统, 当时间t→∞时, 就趋向某种稳定的模式. 在相空间中 , 运动规迹便趋向某条稳定轨道, 称之为“吸引子”. 人们比较熟悉的吸引子是不动点 和极限环(limit cycle), 不动点表明系统将趋向定态, 而极限环是一种周期运动的 模式.
Ruelle和Takens提出了第三种吸引子[12], 这种吸引子具有: a. 稳定性---代表 在有扰动的环境中动力学系统的最终状态; b. 低维性---是在相空间中只有很少自由 度的一条轨道; c. 非周期性---轨道永远不自我重复(即永不相交). 性质a是吸引子的 定义, 表明系统的稳定性; 性质b和c则说明这种吸引子是相空间中在有限的低维体积 内的一条无限长的轨道, 故此称之为“奇怪吸引子”, 以后又被叫做“混沌吸引子” (chaotic attractor). 他们认为这种奇怪吸引子代表了流体中湍流的本质, 提出只 需三个独立运动便可产生湍流的全部复杂性, 而不是象郎道所设想的需要无穷多个自 由度. 这是一种新颖的思想: 看起来象是由无穷个独立运动所叠加而成的复杂行为可 以仅同少数自由度相联系.
第一个奇怪吸引子是Lorenz在研究其人造天气模型时得到的[13], 后来Henon 提 出了一个二维耗散系统中的吸引子[14].
5. Lyapunov指数和吸引子
物理系统主要是由微分方程表示的, 而在一定的条件下, 偏微分方程可简化为常 微分方程. 对于一阶非线性常微分方程组, Lyapunov指数很好地描述了系统在时间t →∞时的行为, 给出了系统在相空间中的拓扑性质: 正指数表示拉伸--- 邻近的点相 互分离, 负指数表示收缩. 若所有Lyapunov指数的总和等于零, 则相空间体积不变, 对应于保守系统; 若指数和小于零, 相空间体积收缩, 对应于耗散系统; 而当指数和 大于零, 相空间体积膨胀, 对应于随机系统[2]. 对不动点吸引子, 所有Lyapunov 指 数都是负的; 具有周期轨道形式的吸引子(如极限环)则有一个指数为零, 其余的指数 均是负的; 而奇怪吸引子的Lyapunov指数至少有一个是正的有限值.
对于自治(即不显含时间)的常微分方程组, 存在奇怪吸引子的必要条件是独立变 量的数目n≥3[2]. n=3的奇怪吸引子, 其Lyapunov指数为(+ 0 -), 而n=4的奇怪吸引 子有两类, 即(+ + 0 -)和(+ 0 - -)[15].
6. 分形(fractal)和分维(fractal dimension)
分形几何学(fractal geometry)是由法国数学家Mandelbrot在七十年代中期创立 的[16], 主要研究自然界中极不规则、极其复杂的几何图形和结构. 八十年代分形理 论已广泛应用于物理学、化学、生物学、地学、经济学、情报学等自然科学和社会科 学领域.
凡是部分与整体以某种方式自相似的体系就是分形, 而描述分形的一个重要参数 是分形维数, 简称分维[17]. 一个普通的“规整”几何对象, 如果把线度放大l倍 , 整个对象就放大为原来的k=lD倍, D就是空间维数. 例如, 当线度放大两倍时, 正方 体的体积增大为原来的23=8倍. 推而广之, 便有维数定义:D=log(k)/log(l),这里D已 经不必是整数了. 最简单的非整数维数的例子是Cantor集(即给定一条线段,将其中间 的1/3去掉, 然后对剩下的两条线段各自去掉其中间的1/3, 如此地进行下去, 最后剩 下的点集就是Cantor集),当线度放大l=3倍时, k=2, 因此D=log2/log3≈0.63. 上述 分维的定义被称之为盒子维数, 也叫Kolmogorov容量, 是Housdorff维数的一种近似, 只适用于完全自相似的几何对象[2] . 对于一般的分形结构 , 还有信息维数 (information dimension) 和相关维数(correlation dimension) 等定义[18].
当Mandelbrot研究信号在传输线中出现误差的问题时, 发现误差与无误差传输的 比值保持恒定, 如同一维分形Cantor集的分布[19], 他实际上看到了时间上的阵发混 沌(intermittent chaos)与分形的关系.
7. 奇怪吸引子的维数
分形在物理学中的最重要的应用便是刻画了奇怪吸引子的特性. 根据奇怪吸引子 的定义[12], 它就是相空间中的一种分形. Kaplan 和 Yorke 给出了吸引子维数与 Lyapunov指数的关系[20]: 不动点的维数是0, 极限环的维数为1, 而奇怪吸引子的必 要条件是系统至少有三个独立变量, 故其维数是在2到n之间(n是系统的独立变量数).
8. 重建相空间(reconstruction of phase portraits)
由混沌的复杂性内涵可以知道它们必然对应着微分方程无解析解. 当然, 我们可 以对非线性方程进行数值计算, 但是需要从所有可能的初始条件出发来研究, 因为非 线性系统存在着“蝴蝶效应”(即对初始条件的敏感性), 尤其在吸引域的边界上对初 始条件极端敏感. 另一方面, 在实际工作中经常得到的是呈时间序列的观测数据, 如 果能从数据中鉴别出低维吸引子(或混沌), 则根据普适性原理可以构造低维模型来解 释观测数据.
Packard等提出了从观测数据重建相空间的方法[21]: 对观测得到的时间序列数 据X(tk)(k=1,2,…), 从某个数据X(tk)开始, 加上适当的时间延迟T, 则{X(tk),X(tk +T),X(tk+2T),…,X(tk+(d-1)T)}构成了d维相空间中的一点, 取不同的X(tk)便得到d 维相空间中的不同点. 当数据足够多时, 在相空间中就呈现出系统轨道的行为. 若d ≥2n+1时, 这样构成的d维图象与实际系统(具有n个独立变量)的真实行为有着同样的 特性(如相同的Lyapunov指数谱)[22], 也就是说, 从时间序列重建的系统相空间可以 合适地替代原初的(可能是未知的)系统.
Roux等[23]使用重建相空间的方法分析了Belousov-Zhabotinskii反应(一种非平 衡均匀化学反应)的实验数据, 发现了奇怪吸引子的存在, 并得到了最大Lyapunov 指 数. Froehling等[24]利用盒子维数来计算重建的相空间中的奇怪吸引子的维数, 并 指出时间延迟T的选取及噪声的影响都是很重要的, 是所有以重建相空间为基础的方 法都必须注意的问题.
二. 天体物理中的混沌及分析方法
1. 时间序列分析与混沌
在时间序列分析中, Fourier变换是使用得最广泛的一种方法. 对于有关混沌分 析, 结合Fourier方法可以检测出周期、倍周期和准周期等现象, 但无法检测出表现 为非周期性的奇怪吸引子, 因此下面介绍的方法主要是针对如何检测奇怪吸引子的.
1) 一次回复映象(first return maps)
Takeuti[25]使用脉动恒星的膨胀相的动能最大值序列T(i)(i=1,2,…) 来研究恒
星的纯周期脉动到不规则脉动的转变, 由于每次脉动应与前次脉动有关, 可以设想在
T(i+1)和T(i)之间存在着关系: T(i+1)=f(T(i)), 则该序列在T(i+1)-T(i)图上呈现
为一条线, 该图被称为一次回复映象. 对于线性脉动有T(i+1)=aT(i), a是正的常数.
若a>1 对应激发状态, a<1 对应阻尼状态. 值(a-1) 实际上是振荡动能在每个脉动周
期中的增长率. 而对非线性脉动, 若其关系曲线与直线T(i+1)=T(i)相交,则在交点左
边的振荡增大而在右边的振荡减小. 当交点处的df/dT(i)>0, T(i)便从一个方向趋向
交点, 这时对应于等幅振荡的稳定极限环(图2(a)); 当-1 Aikawa[26]利用一次回复映象分析了一些恒星脉动的流体力学模型的数值结果. 2) D2方法 Grassberger和Procaccia[27]提出从时间序列中重建相空间后的相关指数为 D2=lim lim ──── , 其中Cd(r)=lim ─ ∑H(r-|Xi-Xj|), 这里H是 Heaviside函数, 而Xi与Xj是重建的d维相空间中的矢量. 在实际计算中, 对每个 d
维相空间计算lnCd(r)在不同ln r处的斜率ν, 将其标在ν-ln r 图上(如图3). 若在
┌───────────────┐某个r范围内ν是常数, 则D2=ν便是奇怪吸引
│ 图3. Her X-1 的奇怪吸引子的 │子的近似维数. 实际上若描述系统的独立变量
│ 维数 │最少有n个, 则对许多低维混沌的情况只要
│ │d≥2n+1就能提供有意义的结果[28]. 如果从观测数据中得到非整数相关维数D2, 则可以获得如下信息: a. 系统是混
沌的(存在奇怪吸引子, 其维数是D2); b. 用于描述系统的有效独立变量数n 便是大
于D2的最小整数; c. 混沌过程的特征时标K-1有着Δt< Voges等[18]和Atmanspacher等[29]用D2方法分析了Her X-1的不规则X 射线强度
变化, 发现其中的混沌吸引子的维数D2≈2.3. Morfill等[28]分析了D2方法中随机噪
声的影响, 并提出了物理模型来解释Her X-1的X射线强度的不规则变化 . Norris 和
Matilsky则强调了噪声对分析结果的影响[30] Zhuravlev和Popov[31]用D2方法分析了PSR 0809+74的射电微脉冲结构, 发现所
分析的脉冲中有20%存在着D2<5, 并且10-100 μs时标的微结构具有独立变量较少的
非线性动力系统的特性, 可能是在相对论性等离子体外流中存在着高度发展的湍流运
动. Fiore和Massaro[32]用D2方法分析了Seyfert星系NGC4051的X射线强度变化, 发
现了D2=6的奇怪吸引子, 第一次表明在AGN中存在着确定性混沌. D2方法是目前在时间序列中检测混沌时使用得最多的一种方法. 3) SVD(singular value decomposition)方法 SVD方法也叫Karhunen-Loeve展开式, 它是基于线性代数的一些简单结果来改进
相空间的重建过程[33]. 若利用时间序列重建了d维相空间, 便可得到该时间序列的d
×d相关矩阵C0, SVD方法就是通过d和时间延迟T的选取, 使得C0的特征值迅速减小到
零(即C0是强奇异的), 这样C0的头几个本征矢量构成的空间便代替了原来的相空间,
将时间序列投影到该空间所形成的轨道就代表了系统的主要特性. 因此SVD 方法是通
过本征矢量的最优化来获取系统信息的. Auvergne[34]用SVD方法分析了脉动白矮星PG1351+489的测光数据, 表明存在着
奇怪吸引子. 他认为该方法能得到描述系统所需独立变量的最小数目, 但无法获得吸
引子维数的信息. 2. 宇宙大尺度结构与分形
文征等[35]提出宇宙大尺度结构可使用体积限定样本的分维分析来代替两点相关
函数分析, 其特点是: 分维计算对分布中的结构以及结构的变化比较敏感, 计算误差
随尺度增加而迅速减小, 这使得它对体积限定样本可以分析到边界效应所允许的最大
尺度; 而且分析中不需要引入任何先验的统计假定, 在相当大的尺度范围内不必用星
系团来代替星系进行分析, 因而能连续地考察从小尺度到大尺度分布特征的演变.
对一个体积限定样本Sv, 采用与任一星系相距小于r的平均星系数N(r), 则大尺
度的分维为: 其中Nr(r)的定义与N(r)相仿, 采用的是在与Sv的相同区域内由Monte Carlo方法产生
的有相同星系数目的随机分布样本Sr, Nr(r)则是在Sr内与任一Sv中的星系相距r以内
的平均随机点数目; 这样可以有效地降低边界效应的影响. D通常是r的函数, 若在某
个尺度范围内D是常数, 则在该尺度范围内星系分布是分形的, 其分维是D.对n维空间
中的分形集, 其中被占据的体积与总体积的比例称为填充因子f, 而f=2D/2n=2D-n .
对星系分布有n=3, 则当D<2时f<0.5, 即星系所占据的空间少于总体积, 故分布中的
主要特征是占据区被空区包围, 即星系是成团的; 而当D>2时f>0.5, 被占据的体积为
多数, 分布的主要特征是被占据的区域包围空区, 即分布是有空洞的泡状结构[36]. 文[35-37]的工作表明光学亮星系和IRAS 星系在较小尺度上呈现成团而在更大尺
度上的分布为泡状结构. 他们认为多级分形很可能是宇宙大尺度结构的一个普遍和重
要的特征. 星系和大尺度结构并非纯粹的无标度的自相似过程, 而是存在着不同结构
间的转变, 这种转变尺度在某种意义上是一种大尺度分布中的特征尺度. 纯引力过程
是无标度的, 不能给出特征尺度, 因此他们的工作是对现有宇宙模型的一个挑战. 3. 星系中恒星的混沌运动 Henon和Heiles[38]在研究银河系中恒星的运动轨道时, 假定恒星是在一个平均
的引力场下运动, 其哈密顿量为H= (p2+p2+q2+q2)+q2q2- q2. 该系统存在两个运
动常数: 总能量E=H和z方向角动量Lz. 将该哈密顿量的运动轨道按条件q1=0,p1≥ 0
画在(q2,p2)平面上(即相当于Poincare截面), 可以看到当能量E很小时, 该截面上的
运动轨迹呈现单一的闭合的卵形, 这是一种周期轨道; 当E 增大时运动轨迹扭曲成更
复杂的形状, 自身交叉为8字形, 然后分裂成隔开的环; 当E再增加时, 某些先前的曲
线消失而成为随机的点状分布, 整个截面上完全的无序与残余的有序混合在一起, 形
成“岛屿”和“岛链”. 他们指出只要有更高的放大倍数, 在越来越小的尺度上会出
现更多“岛屿”, 换句话说该系统进入混沌状态时其结构是一种分形. Gurzadyan和Kocharyan[39]提出了用Ricci曲率方法来研究 N体系统的统计性质,
该方法的思想是: 哈密顿运动方程可化为在确定的Riemann流形下的测地线方程, 而
该流形的Ricci曲率值提供了哈密顿系统的统计性质的明确信息. 他们对有25 个引力
粒子的系统进行了数值计算, 发现系统中心质量的存在可导致相当的不稳定性, 而结
论不依赖于系统的能量、角动量、恒星速度分布等, 并且盘系统要比球对称系统的混
沌程度低, 由此对星系和星团按照其混沌程度进行了分类. 他们认为计算在测地线速
度方向上的Ricci曲率是对多维动力系统的统计性质进行数值研究的一种有效方法. Caranicolas和Innanen[40]研究了在具有盘晕和球形核的星系中恒星从规则运动
向混沌运动的转变, 发现星系盘面附近运动的恒星在其角动量Lz小于特征值Lzc(L zc
与星系核心质量Mn成线性关系)时, 当运动到核心附近便被散射到晕中去, 并表现出
混沌运动. 他们认为在具有凸起核球的盘星系中, 与核球相关的恒星运动是明显地处
在混沌轨道上的. 4. 天体系统中混沌现象的几个例子 Buchler和Kovacs[41]计算了恒星脉动的一系列流体动力学模型, 发现了倍周期
分叉及其向混沌的转化, 其中控制参数是恒星的有效温度, 并将这些模型分类为
W Vir型、RV Tau型和半规则型. Aikawa[42]检验了其中的一些模型, 发现也存在阵
发现象造成的混沌, 并讨论了在光变曲线中阵发现象导致的高度不规则振荡的爆发.
Goupil等[43]分析了脉动白矮星PG1351+489的测光数据, 发现在Fourier谱中存在着
分谐波及其倍频, 有力地说明了该星经历过倍周期分叉, 而且其时间特性隐含着更复
杂的动力学[34], 他们用方程X'''+kX''+X'+kμX(1+βX)=0来定性地建立类似的动力
学行为. Demmel和Atmanspacher[44]用离散时间动力学模型研究中子星的球吸积过程, 主
要特征是在质量吸积与逸出的X射线辐射之间的非线性反馈机制, 发现该系统存在稳
定的混沌式光度变化, 其中控制参数是吸积率M. Morfill等[28]也讨论了Her X-1中X
射线光度变化的物理解释, 特别是研究了脉冲星的脉冲形状与变化的意义, 以进一步
理解吸积盘和吸积柱所起的作用. Kurths和Karlicky[45]分析了太阳射电的脉动事件的时间序列, 发现了从规则双
周期相到不规则相的演化, 且在不规则相存在着低维吸引子, 由最大Lyapunov指数的
估计表明其中有混沌的存在. 结论 混沌理论为我们开辟了一个崭新的天地: 简单的系统会出现极复杂的行为, 复杂
性的表观下面存在着简单的有序, 不同的系统的复杂行为有着相似甚至相同的结构.
这也就为研究复杂行为提供了一种新的方式: 只要抓住问题的本质, 就可以用常微分
方程代替偏微分方程, 可以用时间离散的迭代方程代替常微分方程, 也可以用极简单
的系统来模拟出相似的复杂性. 最近几年来, 对天体物理中的混沌现象的研究与日俱增, 研究方法也在逐渐增多,
使得我们在研究天体物理问题时又多了一些工具. 例如: 在貌似随机噪声的数据中,
也许存在着奇怪吸引子; 当看到系统中存在着分频谐波、准周期或阵发性爆发( 如高
能天体的暂现现象), 则该系统可能在另外的条件下表现出混沌行为. 然而现有的分
析方法尚有待于发展与完善, 比如在时间序列分析中所需的观测数据的点数较多, 且
要求较高的信噪比, 因此限制了它们在天体物理中的运用. --- 而这正是要求我们为
之努力改进的地方. 参考文献