关于微分方程
Abstract Keywords Reprint 数学
Citation Yao Qing-sheng.关于微分方程.FUTURE & CIVILIZATION Natural/Social Philosophy & Infomation Sciences,20191201. https://yaoqs.github.io/20191201/guan-yu-wei-fen-fang-cheng/
本帖是在苹果的 bbs 上看到的,有助于写毕业论文的,可以看看参考。
微分方程系统
科学家常常自称在探索大自然的奥秘,当获得一定的成功后,他们惊喜地宣布:“瞧,我找到了!”
科学家找到了什么?找到了打开自然之门的钥匙,他们发现了大自然的组织奥秘,知道世界 原来就是这般运行的。
在一般意义上说,这样理解不算错误,但是在哲学意义上,这种看法是有问题的,至少显得 有些狂妄。人与自然的关系无论从对象的意义上看,还是从包含意义上看,都是复杂的,人 类理解自然任何时候都一定是不全面的。人类的所有知识系统的总和如果与大自然相比的话 ,仍然渺小得很。人们任何时候都不能得意地宣称自己完全理解了大自然的运行,找到了一 切规律。
科学不是一天一天在进步吗?依靠科学人类不是取得了一个又一个辉煌技术成就吗?难道人类 理智的进化不具有坚实的标准吗?
令人眼花缭乱的千奇百怪的技术通常让人们感觉人类太伟大了,今日的社会真正飞速发展, 比以往任何时候发展得都快;人类是万物之灵,只有人类理解了自然的语言,知道大自然的 规律。其实这是一种错觉,人类只是一个物种,今日社会与昨日社会甚至原始社会发展步调 没什么两样,人类的自然生存能力不但没有发展,而且逐日下降。动物、植物也理解大自然 的语言,如果说真的有什么语言的话,而且它们理解得也许并不比我们差。
人是自然界的一部分,是自然演化链条中某个环节的产物,所以人与自然有相通、统一的一 面,但人认识自然所达到的知识系统本身不是自然的全部,只是对大自然拙劣的摹仿。在认 识框架中,人 —— 自然 —— 模型总是以三角关系存在的。模型有许多种,不同人也使用不同 的模型,科学家所使用的模型一般有严格的定义,互相之间可以理解。
从数学角度最一般地看问题,迄今为止科学家使用的模型分两大类,一类是只与时间演化 有关的模型,另一类是除了时间外还与空间变化有关的模型。前者叫拉格朗日型模型 (Lagrangian models),后者叫欧拉型模型 (Eulerian models)。模型也就是函数,因而前者 可简单表示为 f (t), 后者可简单表示为 f (x,t),其中 t 代表时间,x 代表空间。
在拉格朗日型模型中,只有时间 t 是独立变量,这类模型主要包括常微分方程 (ordinary differential equations, 简记 ODE) 和差分方程 (difference equations,简记 DE),后者也叫映射。此外还有格子映射 (lattice maps, 简记为 LM)。用整数 m 和 n 表示维数 (方程式的个数),R 记连续欧氏空间,Z 记实整数,t 代 表时间,x (t) 代表模型 (时间的函数)。当 t∈R,x (t)∈R^n 时,有常微分方程。当 t∈Z,x (t)∈R^n 时,有差分方程。当 t∈Z,x ( t)∈Zn 时,有格子映射。显然,至少还有一种重要的逻辑可能性,即 t∈R,x (t)∈Zn,暂且叫它突变模型 (catastrophe models)。突变模型是很有价值的,它代表时间连续变化,但物理量却离散变 化的类型,比如地震就是这种情况。
在欧拉型模型中,时间 t 和空间 x 都是独立变量。当时间和空间都是实的且连 续时,有偏微分方程 (partial differential equations, 简记 PDE),用符号表示就是 t∈R,x∈R^n,f (x,t)∈ R^m。若时间连续,空间取离散的元胞,在每个元胞内用 m 个函数描述演 化规律 (图灵 (A.M.Turing,1912-1954) 称描写元胞内演化规律的方程为 “生形式” (morphogens), 实际上是一组常微分方程),这种模型可叫作元胞微分模型 (cellular differential models, 简记为 CDE),用符号表示就是 x∈R,x∈ Zn,f(x,t)∈Rm。
当时间和空间都取离散值,而函数取连续值时,我们有耦合映射 (coupled maps, 简记 CM), 用符号表示则为 t∈Z,x∈Z^n,f (x ,t)∈R^m。最后一种是全部取离散值,对应于冯・诺伊曼和乌 拉姆发明的元胞自动机 (cellular automata, 简记 CA),用符号表示则为 t∈Z ,x∈Zn,f(x,t)∈Zm。欧 拉型模型的任务是,如何将空间上定域性的规则与整体时空动力学模式 (patterns) 联系起来 。这里的 “模式” 指空间位形的相关性,与拉格朗日型模型中相空间变量的相关性不是一回 事。
9.2 龙格 - 库塔积分法
上节提到了许多模型,最基本的还是迭代 (映射) 和常微分方程。本章主要讲常微分方程 (ODE ) 系统,由于通常的微分方程无法解析求解,在实际应用过程中,总是采用数值积分求解。在数值积分中,将连续过程转化为离散迭代。
我们在《常微分方程》或者《数学分析》课程中接触过一些微分方程和求解方法,但那里似 乎给出一种错误的印象:精确求解是最重要的并且总能做到。事实上正相反,在通常情况下了解微分方程的整体几何定性状况非常重要。比较几本教科书就会发现,能解的方程总是那 么几个典型例子。但愿新的教科书能够注意。
从现代数理科学发展的趋势看,理工科学生应当首先学习微分方程的几何理论 (也叫定性理 论),然后学习常系数线性微分方程精确求解方法,接着学习数值积分方法。最常用并且效 果较好的积分方法是龙格库塔积分法 (Runge-Kutta integration method)。作者在北大 专门作过调查,相当一部分理工科本科生、研究生从未听说过龙格库塔数值积分法,在这 里略作介绍也是必要的。微分方程数值积分主要有三种方法:1) 欧拉法 (Euler method) 和中点欧拉法 (midpoint Euler method,也叫修正欧拉法);2) 亚当斯法 (Adams method);3) 由德国的两位数学家龙 格 (C.D.T.Runge,1856-1927) 和库塔 (M.W.Kutta,1867-1944) 提出的龙格 - 库塔法,它的特点 是收敛速度比欧拉法快。设微分方程组 (一般是非线性的) 为
dx/dt=F(x,t),x∈R^m
其中 x 是 m 维向量,t 代表时间,上式代表由 m 个方程组成的常 微分方程组。取固定时间步长 t=nΔ(n=0,1,2,…),令 x n≡x (nΔ)。采用四阶龙格 - 库塔法积分,每一步的误 差相当于 CΔ^5,其中 C 是与函数 F 有关的常数。求 x 的迭代关 系式为
x (n+1)=x_n+1/6(K_1+ 2K_2+2K_3+K_4)+O(Δ^5)
其中
K_1≡Δ·F(x_n,nΔ),
K_2≡Δ·F[x_n+K_1/2, (n+1/2)Δ],
K_3≡Δ·F[x_n+K_2/2, (n+1/2)Δ],
K_4≡Δ·F[x_n+K_3,(n+1)Δ].
如果是自治 (autonomous) 微分方程,上述的 K_i (i=1,2,3,4) 可以简化 为
K_1≡Δ·F(x_n),
K_2≡Δ·F(x_n+K_1/2),
K_3≡Δ·F(x_n+K_2/2),
K_4≡Δ·F(x_n+K_3).
“自治” 的含义是微分方程右端不显含时间 t,即方程的形状为 dx/d t=F (x)。任何非自治方程都可以通过增加一维而变成自治方程。以上说的是固定积分步长的积分,它的好处是比较简单,缺点是有时不够精确。动力系统有 快流形 (fast manifolds) 和慢流形 (slow manifolds),在积分过程中可以采用变步长的方 法,在快流形上积分步长取得小些,在慢流形上积分步长取得大一些。比如龙格库塔法的梅森 (Merson) 修正方案就是一种变步长积分法。
9.3 洛仑兹混沌
洛仑兹 (E.N.Lorenz,1917-) 混沌吸引子已成为混沌理论的徽标,代表着复杂性新科学,好 比行星轨道图代表着哥白尼、开普勒理论一样。英国的《新科学家》杂志曾办了一个专栏, 每一期的刊头都有洛仑兹吸引子标记。在国内清华大学曾国屏 (1953- ) 撰写的《自组织的自 然观》一书封面一共选了三幅图:道家的阴阳鱼、行星轨道图和洛仑兹混沌图,三张图分别 位于一个魔方 (也可视为骰子) 外显的三个面上。这种设计是很有趣的,作者试图用三幅图分 别代表三种世界图景,第一种是各国早期朴素的辩证自然观,第二种是近代科学形成的还原 论的自然观,第三种是以自组织理论、复杂性理论为标志的新型自然观。
以前科学家们不自觉地认为微分方程的解只有那么几类:1) 发散轨道;2) 不动点;3) 极限环 ;4) 极限环面 (torus,复数形式为 tori)。除此以外,大概没有新的运动类型了,这是人们 的一种主观猜测,谁也没有给出证明。事实上这种想法是非常错误的。1963 年美国麻省理工 学院气象科学家洛仑兹给出一个具体模型,清楚地展示了一种新型运动体制:混沌运动,轨 道既不收敛到极限环上也不跑掉。
洛仑兹是学数学出身的,1948 年起在 MIT 作动力气象学博士后工作,1963 年他在《大气科学 杂志》上发表的论文《确定性非周期流》是混沌研究史上光辉的著作,无论怎样评价都不算 过分。[有关此文的发表经过可参见洛仑兹的专著《混沌的本质》(The Essense of Chaos) 第四章,中译本由刘式达等翻译,气象出版社 1997 年出版。] 而略带腼腆的洛仑 兹在回顾自己的成就时总是十分谦虚。大家应当注意的是,他在那个时代就使用了计算机, 如果不用计算机他肯定发现不了确定性非周期流,不可能就 “系统长期行为不可预测” 作出 判断。现在科学家使用计算机已成为一种时髦,而那时却是一种冒险。
说了半天,早该给出洛仑兹方程的具体形式了,学数理的朋友们最喜欢公式 (但学文的正相 反)。洛仑兹方程极其美妙,多少年来,人们并未逃出洛仑兹方程的框架,找来找去能出现 混沌的系统总是与洛仑兹系统差不多。洛仑兹方程形式很简单,只有三个方程:
dx/dt=-σ(x-y),
dy/dt=rx-y-xz,
dz/dt=xy-bz,
其中 σ,r,b 是正的参数,这是一个自治的三阶方程组。此方程所 表示的向量场的散度 为 divF = 偏 f_1 / 偏 x + 偏 f_2 / 偏 y + 偏 f_3 / 偏 z=-σ-1-b=-(σ+1+b)<0.
所以洛仑兹系统是耗散的,相体积不断收缩。此方程虽然能一定程度上描述天气的复杂变化 过程,但它的真正意义并不在气象预报上!他首先是数学家,他用数学来思考问题。因而他 的模型及其从中所揭示出的新的运动体制的意义,就远远不止于气象学。
现在大家都已清楚,在二维连续系统中不可能出现混沌,三维是出现混沌所要求的最低维数 。洛仑兹模型恰好只有三维。
对于洛仑兹方程,一般是固定参数 σ 和 b,单独考察 r 变化时,系统 行为的变化。当 0<r<1 时,有一个稳定不动点 O (0,0,0);当 1<r <r^*≡1.34561… 时 (对于 σ=10,b=8/3),又出现两个新的稳定不动 点 A 和 B,这时共有 3 个不动点,不动点 O 已变为不稳定不动点。 A 和 B 的性质总是相同的,因为方程在变换 (x,y,z)→ (-x,-y,z) 下是不变的。当 r 继续增大到 r_t=σ (σ+b+3)/(σ-b-1)=24.7368… 时 (对于 σ=10, b=8/3),方程的 3 个不动点都变得不稳定了,r_t 是系统行为变化的临界点, 这时就出现了洛仑兹发现的 “确定性非周期流”。1963 年洛仑兹研究时 3 个参数的取值为: σ=10,b=8/3,r=28。 这组参数值通常称标准情形 (canonical case) 。当年洛仑兹就是在这一组参数值下,采用计算机数值计算,发现了奇怪吸引子。当时还没 有这一概念,直到 1971 年吕埃尔 (D.Ruelle) 和塔肯斯 (F.Takens) 才提出 “strange attractor” 一词。
洛仑兹的伟大贡献是多方面的,可以轻易举出几条:
1) 为非线性动力学研究贡献了一个绝好的数学模型,值得推崇的不是此模型在多大程度上 直接反映了某个具体的物理现象,而是它抓住了复杂性的本质,为进一步深入探索各种复杂 事物奠定了坚实的基础。
2) 洛仑兹有一套清晰的研究方法,《确定性非周期流》一文运用的一系列合理的 “工作程序”,已被 70 年代末以来的混沌学家广泛采用。
3) 定性的数学分析与计算机定量模拟相结合,开创了复杂性研究的新方法。在现在看来使 用计算机是件平常的事,但在 60 年代初,这是不平凡的。特别是,他识破了复杂系统中 “对 初始条件的敏感依赖性”,能够正确地理解数值计算结果,显示了一位杰出科学家的洞察力 。
苏联著名学者安德罗诺夫 (A.A.Andronov,1901-1952) 一生 “工作在相平面上”,对非线性 振动有深刻理解,但最终没有发现混沌,没有完成质的飞跃。关键性的一步似乎注定要让美 洲的另一人来迈出。
1972 年美国马里兰大学的费勒 (A.Feller) 教授在研究气象问题时偶然发现了洛仑兹 1963 年 以及后来的几篇论文,他本人对洛仑兹的论文并不太感兴趣,虽然认为其中的观点很重要。 费勒把洛仑兹的 4 篇论文一起交给了本校的数学教授约克。李天岩后来介绍,“若不是 Feller 教授,我们不太可能有机会接触到它。那段时间,我们读了洛仑兹写的文章,觉得很 有意思。”1973 年 4 月的一天,约克告诉李天岩有一个好想法,即后来出了名的李 - 约克定 理 (Li-Yorke theorem),大约两周后李天岩顺利证明出了此定理。论文寄到了《美国数学月 刊》,不久被退了回来。编辑建议另投其他刊物或改得通俗一点。因为 “月刊” 不登专门的 研究论文。约克坚持再寄回去,可李天岩一直没有去修改它,这样该论文在李的办公桌上躺 了近一年。1974 年是马里兰大学数学系的生物数学特别年,一次请普林斯顿大学赫赫有名的 生物学教授罗伯特・梅来校演讲,最后一天讲到了生物学中非常重要的逻辑斯蒂模型:
f_r(x)=rx(1-x), x∈[0,1], 0<r<4.
梅报告了当参数较小时此方程的迭代将导致周期倍分岔。特别地当 r=4 时,x 值在 0 和 1 之间跑来跑去,他无法解释这种现象,以为是计算误差造成的。约克立即意识到这 些与李 - 约克定理有关,在送梅上飞机时约克给梅看了那篇未发表的论文,梅大吃一惊,他 认为这个定理在很大程度上解答了他的疑问。约克从机场回来立刻跑到李天岩那里,说要马 上改写那篇文章。结果 “周期三蕴含混沌” 刊登在了《美国数学月刊》1975 年第 12 期上。梅 到欧洲各处演讲,李约克定理也名扬天下,并且洛仑兹吸引子也被广为介绍,以前梅并不 知道洛仑兹的工作。
9.4 若斯勒混沌
1976 年若斯勒对洛仑兹模型进行再建模,化简出一个新的方程组,仍然能够产生混沌。洛仑 兹混沌吸引子是对称的,而若斯勒混沌吸引子丧失了对称性,整体结构颇像单侧曲面 —— 麦 比乌斯 (A.F.Mobius,1790-1868) 带。若斯勒方程的具体形式为
dx/dt=-y-z,
dy/dt=x+ay,
dz/dt=b+z (x-c),其中 a,b 和 c 都是正的参数,方程中只含有一个非线性项 z x,而洛仑兹方程含有两个非线性项。从形式上看若斯勒方程的确比洛仑兹方程简单。 显然,这也是一个自治的常微分方程,右端不显含时间。先对系统作定性分析,将原系统划分为两个相互关联的子系统,第一个子系统由前两个方程 代表,第二个子系统由第三个方程代表。当 z 足够小时,第一个方程中的 z 可 以暂时忽略,这时第一个子系统可以暂时简化为
dx/dt=-y,
dy/dt=x+ay,
它实际上是一个二阶线性振子,将第一个方程代入第二个方程立即得到如下微分方程:
d2x/dt2-a(dx/dt)+x=0.
学过振动理论的对此方程一定是非常熟悉的,当 a 为正数时,它代表负阻尼振子的振 动情况。在相平面 (x,y) 上考虑问题,原点 (0,0) 是一个不稳定焦点 (focus) ,轨线从原点附近向外盘旋,圈越转越大。大到一定程度,整个系统的非线性 (在第三个方 程中体现出来) 就必须考虑了。非线性起什么作用呢?非线性限制了轨线无限制向外盘旋。如 果没有非线性,轨线很快奔向无穷远处。非线性项的存在阻止了这一点。我们看第三个方程 ,当 x 大于 c 时,z 的系数变正,取 b 为正值,这时第三个方程 所代表的子系统变得不稳定。非线性项起作用的结果是 z 值增大,而 z 增大的结果又会导致 x 减小, 因为 z 增大后,第一个方程中右端变小,以至于成为负值,于是 x 减小。x 逐步变小,以至于小于 c,这样又会使 z 变小,相轨道逐渐落入 ( x,y) 平面,并接近原点。这时第三个方程又是次要的了,第一个子系统 起支配作用,轨道又向外盘旋,再升高,再收缩,再降低,等等。定性上分析,轨道运动大 概就是这个样子:在 (x,y) 平面上拉伸,在 z 轴方向折叠。两个子系 统奇妙地耦合在一起 (通过非线性),子系统的稳定性交替变化,相互制约。若斯勒系统的数值积分程序与洛仑兹系统的完全一样,没必要单独写出来。不过,现在要考 虑另一件重要的事情:吸引子的任意投影。在此之前我们只能做 XOY,XOZ,YOZ 三个 特殊方向上的投影,而这是很不够的。在计算三维微分方程系统时,得到三维数据 (x ,y,z),任意角度投影的思想就是将这三维数据压缩成两维,并使这两 维的数据仍然包含原来三维数据的信息,也就是说想找到一种变换,使 (x,y ,z)→(X_N,Y_N),只要指定两个投影角度,就能顺利得出变换公式。设投影 角度分别是 θ 和 φ,则投影算法为:
X_N=xcosθ-ysinθ,
Y_N=xsinθsinφ+ycosθsinφ+ zcosφ,
Z_N=xsinθcosφ+ycosθcosφ- zsinφ.
9.5 布鲁塞尔子
从 70 年代末开始,在耗散结构 (dissipative structures) 的题目下,一个假想的三分子化学 反应动力学系统就被广泛研究了,其中比利时布鲁塞尔自由大学普里高津 (I.Prigogine,191 7- ) 教授领导的学派为此作出巨大贡献,于是这个模型被叫做布鲁塞尔模型。进入 80 年代, 非线性动力学兴起,人们以混沌的眼光重新考察这个系统,加上一个三角函数策动项,得到 受迫布鲁塞尔模型,生成的混沌吸引子遂被称为布鲁塞尔子 (Brusselator)。1982 年郝柏林 和张淑誉 (1933- ) 在《统计物理杂志》上著文《混沌带的层次结构》, 详细讨论了布鲁塞尔 三分子系统。1983 年茹克斯 (J.-C.Roux) 等人在《Physica 8D》上著文《奇怪吸引子的观测 》, 从实际 BZ 反应 (Belousov-Zhabotinskii reaction) 数据中构造出奇怪吸引子。至此,非 线性动力学方法已深入到理论化学与应用化学中去。
在科学史上,三分子化学反应动力学模型起过重要作用,它是耗散结构理论的一个重要组成 部分。在那里人们用它来说明在开放系统中,如何通过分岔,由平衡到近平衡,再到远离平 衡,以至最后出现耗散结构。但是单纯在耗散结构的框架中,人们始终未能清楚地说明究竟 是什么起了关键性的作用。到了 80 年代,从非线性动力学角度看,事情才比较明朗:是非线 性起关键作用,它引起系统远离平衡,出现新结构。非但如此,非线性动力学还阐述了细节 过程,指出周期倍化分岔,周期骨架与混沌带的关系,找到了普适常数等,从而将这一特殊 的方程,纳入更一般的非线性科学的理论与方法,使之成为其中的一个特例。这段历史展示 了科学界的关注重点从非平衡到非线性的转移。
现在我们看受迫布鲁塞尔模型
dx/dt=A-(B+1)x+x^2y+α cos(ωt),
dy/dt=Bx-x^2y,
其中 A,B,α 和 ω 都是参数,第一个方程最后一项 α cos (ωt) 表示外部周期策动 (如 果去掉这一项就得到原始的布鲁塞尔模型)。这是一个非自治的二阶微分方程系统,因为右 端显含时间。它等价于一个三阶的自治微分方程系统 (可化成多种形式)。本节里,我们直接 对其进行数值积分,而不是先把它化成自治系统。郝柏林的文章提到,为了提高计算速度, 应避免多次计算三角函数,于是他们通过增加变量将原方程化成四阶方程再进行计算。那时 候是 80 年代初,考虑计算速度是有道理的,而现在微机的速度都非常快 (用 486DX/80 足矣!) ,根本不需要化二阶为四阶。
Address:Department of Natural/Social Philosophy & Infomation Sciences, CHINA
Biography...
Like this article? Support the author with