关于微分方程

Abstract

Citation Yao Qing-sheng.关于微分方程.FUTURE & CIVILIZATION Natural/Social Philosophy & Infomation Sciences,20191201. https://yaoqs.github.io/20191201/guan-yu-wei-fen-fang-cheng/

本帖是在苹果的bbs上看到的，有助于写毕业论文的，可以看看参考。

微分方程系统

科学家常常自称在探索大自然的奥秘，当获得一定的成功后，他们惊喜地宣布：“瞧，我找到了!”
科学家找到了什么?找到了打开自然之门的钥匙，他们发现了大自然的组织奥秘，知道世界原来就是这般运行的。

在一般意义上说，这样理解不算错误，但是在哲学意义上，这种看法是有问题的，至少显得有些狂妄。人与自然的关系无论从对象的意义上看，还是从包含意义上看，都是复杂的，人类理解自然任何时候都一定是不全面的。人类的所有知识系统的总和如果与大自然相比的话，仍然渺小得很。人们任何时候都不能得意地宣称自己完全理解了大自然的运行，找到了一切规律。

科学不是一天一天在进步吗?依靠科学人类不是取得了一个又一个辉煌技术成就吗?难道人类理智的进化不具有坚实的标准吗?

令人眼花缭乱的千奇百怪的技术通常让人们感觉人类太伟大了，今日的社会真正飞速发展，比以往任何时候发展得都快；人类是万物之灵，只有人类理解了自然的语言，知道大自然的规律。其实这是一种错觉，人类只是一个物种，今日社会与昨日社会甚至原始社会发展步调没什么两样，人类的自然生存能力不但没有发展，而且逐日下降。动物、植物也理解大自然的语言，如果说真的有什么语言的话，而且它们理解得也许并不比我们差。

人是自然界的一部分，是自然演化链条中某个环节的产物，所以人与自然有相通、统一的一面，但人认识自然所达到的知识系统本身不是自然的全部，只是对大自然拙劣的摹仿。在认识框架中，人——自然——模型总是以三角关系存在的。模型有许多种，不同人也使用不同的模型，科学家所使用的模型一般有严格的定义，互相之间可以理解。

从数学角度最一般地看问题，迄今为止科学家使用的模型分两大类，一类是只与时间演化有关的模型，另一类是除了时间外还与空间变化有关的模型。前者叫拉格朗日型模型 (Lagrangian models)，后者叫欧拉型模型(Eulerian models)。模型也就是函数，因而前者可简单表示为f(t),后者可简单表示为f(x,t)，其中 t代表时间，x代表空间。

在拉格朗日型模型中，只有时间t是独立变量，这类模型主要包括常微分方程 (ordinary differential equations,简记ODE)和差分方程(difference equations，简记 DE)，后者也叫映射。此外还有格子映射(lattice maps,简记为LM)。用整数m和n 表示维数(方程式的个数)，R记连续欧氏空间，Z记实整数,t代表时间，x(t)代表模型(时间的函数)。当t∈R,x (t)∈R^n时，有常微分方程。当t∈Z,x (t)∈R^n时，有差分方程。当t∈Z,x( t)∈Z^{n时，有格子映射。显然，至少还有一种重要的逻辑可能性，即t∈R,x(t)∈Z}n，暂且叫它突变模型 (catastrophe models)。突变模型是很有价值的，它代表时间连续变化，但物理量却离散变化的类型，比如地震就是这种情况。

在欧拉型模型中，时间t和空间x都是独立变量。当时间和空间都是实的且连续时，有偏微分方程(partial differential equations,简记PDE)，用符号表示就是 t∈R,x∈R^n，f(x,t)∈ R^m。若时间连续，空间取离散的元胞，在每个元胞内用m个函数描述演化规律(图灵(A.M.Turing,1912-1954)称描写元胞内演化规律的方程为“生形式” (morphogens),实际上是一组常微分方程)，这种模型可叫作元胞微分模型(cellular differential models,简记为CDE)，用符号表示就是x∈R,x∈ Z^{n，f(x,t)∈R}m。

当时间和空间都取离散值，而函数取连续值时，我们有耦合映射(coupled maps,简记CM)，用符号表示则为t∈Z,x∈Z^n,f(x ,t)∈R^m。最后一种是全部取离散值，对应于冯·诺伊曼和乌拉姆发明的元胞自动机(cellular automata,简记CA)，用符号表示则为t∈Z ,x∈Z^n,f(x,t)∈Zm。欧拉型模型的任务是，如何将空间上定域性的规则与整体时空动力学模式(patterns)联系起来。这里的“模式”指空间位形的相关性，与拉格朗日型模型中相空间变量的相关性不是一回事。

9.2 龙格-库塔积分法

上节提到了许多模型，最基本的还是迭代(映射)和常微分方程。本章主要讲常微分方程(ODE )系统，由于通常的微分方程无法解析求解，在实际应用过程中，总是采用数值积分求解。在数值积分中，将连续过程转化为离散迭代。

我们在《常微分方程》或者《数学分析》课程中接触过一些微分方程和求解方法，但那里似乎给出一种错误的印象：精确求解是最重要的并且总能做到。事实上正相反，在通常情况下了解微分方程的整体几何定性状况非常重要。比较几本教科书就会发现，能解的方程总是那么几个典型例子。但愿新的教科书能够注意。

从现代数理科学发展的趋势看，理工科学生应当首先学习微分方程的几何理论(也叫定性理论)，然后学习常系数线性微分方程精确求解方法，接着学习数值积分方法。最常用并且效果较好的积分方法是龙格库塔积分法(Runge-Kutta integration method)。作者在北大专门作过调查，相当一部分理工科本科生、研究生从未听说过龙格库塔数值积分法，在这里略作介绍也是必要的。微分方程数值积分主要有三种方法：1)欧拉法(Euler method)和中点欧拉法(midpoint Euler method，也叫修正欧拉法)；2)亚当斯法(Adams method)；3)由德国的两位数学家龙格(C.D.T.Runge,1856-1927)和库塔(M.W.Kutta,1867-1944)提出的龙格-库塔法，它的特点是收敛速度比欧拉法快。设微分方程组(一般是非线性的)为
dx/dt=F(x,t),x∈R^m
其中x是m维向量，t代表时间，上式代表由m个方程组成的常微分方程组。取固定时间步长t=nΔ(n=0,1,2，…)，令x n≡x(nΔ)。采用四阶龙格-库塔法积分，每一步的误差相当于CΔ^5，其中C是与函数F有关的常数。求x的迭代关系式为
x(n+1)=x_n+1/6(K_1+ 2K_2+2K_3+K_4)+O(Δ^5)
其中

K_1≡Δ·F(x_n,nΔ),
K_2≡Δ·F［x_n+K_1/2, （n+1/2)Δ］,
K_3≡Δ·F［x_n+K_2/2, （n+1/2)Δ］,
K_4≡Δ·F［x_n+K_3，（n+1)Δ］.

如果是自治(autonomous)微分方程,上述的K_i(i=1,2,3,4)可以简化为
K_1≡Δ·F(x_n),
K_2≡Δ·F(x_n+K_1/2),
K_3≡Δ·F(x_n+K_2/2),
K_4≡Δ·F(x_n+K_3).

“自治”的含义是微分方程右端不显含时间t，即方程的形状为dx/d t=F(x)。任何非自治方程都可以通过增加一维而变成自治方程。以上说的是固定积分步长的积分，它的好处是比较简单，缺点是有时不够精确。动力系统有快流形(fast manifolds)和慢流形(slow manifolds)，在积分过程中可以采用变步长的方法，在快流形上积分步长取得小些，在慢流形上积分步长取得大一些。比如龙格库塔法的梅森(Merson)修正方案就是一种变步长积分法。

9.3 洛仑兹混沌

洛仑兹(E.N.Lorenz,1917- )混沌吸引子已成为混沌理论的徽标，代表着复杂性新科学，好比行星轨道图代表着哥白尼、开普勒理论一样。英国的《新科学家》杂志曾办了一个专栏，每一期的刊头都有洛仑兹吸引子标记。在国内清华大学曾国屏(1953- )撰写的《自组织的自然观》一书封面一共选了三幅图：道家的阴阳鱼、行星轨道图和洛仑兹混沌图，三张图分别位于一个魔方(也可视为骰子)外显的三个面上。这种设计是很有趣的，作者试图用三幅图分别代表三种世界图景，第一种是各国早期朴素的辩证自然观，第二种是近代科学形成的还原论的自然观，第三种是以自组织理论、复杂性理论为标志的新型自然观。

以前科学家们不自觉地认为微分方程的解只有那么几类：1)发散轨道；2)不动点；3)极限环；4)极限环面(torus，复数形式为tori)。除此以外，大概没有新的运动类型了，这是人们的一种主观猜测，谁也没有给出证明。事实上这种想法是非常错误的。1963年美国麻省理工学院气象科学家洛仑兹给出一个具体模型，清楚地展示了一种新型运动体制：混沌运动，轨道既不收敛到极限环上也不跑掉。

洛仑兹是学数学出身的，1948年起在MIT作动力气象学博士后工作，1963年他在《大气科学杂志》上发表的论文《确定性非周期流》是混沌研究史上光辉的著作，无论怎样评价都不算过分。[有关此文的发表经过可参见洛仑兹的专著《混沌的本质》(The Essense of Chaos)第四章，中译本由刘式达等翻译，气象出版社1997年出版。]而略带腼腆的洛仑兹在回顾自己的成就时总是十分谦虚。大家应当注意的是，他在那个时代就使用了计算机，如果不用计算机他肯定发现不了确定性非周期流，不可能就“系统长期行为不可预测”作出判断。现在科学家使用计算机已成为一种时髦，而那时却是一种冒险。

说了半天，早该给出洛仑兹方程的具体形式了，学数理的朋友们最喜欢公式(但学文的正相反)。洛仑兹方程极其美妙，多少年来，人们并未逃出洛仑兹方程的框架，找来找去能出现混沌的系统总是与洛仑兹系统差不多。洛仑兹方程形式很简单，只有三个方程：

dx/dt=-σ(x-y)，
dy/dt=rx-y-xz，
dz/dt=xy-bz，

其中σ，r，b是正的参数，这是一个自治的三阶方程组。此方程所表示的向量场的散度为divF=偏f_1/偏x+偏f_2/偏y+偏f_3/偏 z=-σ-1-b=-(σ+1+b)＜0.

所以洛仑兹系统是耗散的，相体积不断收缩。此方程虽然能一定程度上描述天气的复杂变化过程，但它的真正意义并不在气象预报上!他首先是数学家，他用数学来思考问题。因而他的模型及其从中所揭示出的新的运动体制的意义，就远远不止于气象学。

现在大家都已清楚，在二维连续系统中不可能出现混沌，三维是出现混沌所要求的最低维数。洛仑兹模型恰好只有三维。

对于洛仑兹方程，一般是固定参数σ和b，单独考察r变化时，系统行为的变化。当0＜r＜1时，有一个稳定不动点O(0,0,0)；当1＜r ＜r^*≡1.34561…时(对于σ=10,b=8/3)，又出现两个新的稳定不动点A和B，这时共有3个不动点，不动点O已变为不稳定不动点。 A和B的性质总是相同的，因为方程在变换(x,y,z)→ (-x,-y,z)下是不变的。当r继续增大到r_t=σ (σ+b+3)/(σ-b-1)=24.7368…时(对于σ=10, b=8/3)，方程的3个不动点都变得不稳定了，r_t是系统行为变化的临界点，这时就出现了洛仑兹发现的“确定性非周期流”。1963年洛仑兹研究时3个参数的取值为： σ=10,b=8/3,r=28。这组参数值通常称标准情形(canonical case) 。当年洛仑兹就是在这一组参数值下，采用计算机数值计算，发现了奇怪吸引子。当时还没有这一概念，直到1971年吕埃尔(D.Ruelle)和塔肯斯(F.Takens)才提出“strange attractor”一词。

洛仑兹的伟大贡献是多方面的，可以轻易举出几条：

1)为非线性动力学研究贡献了一个绝好的数学模型，值得推崇的不是此模型在多大程度上直接反映了某个具体的物理现象，而是它抓住了复杂性的本质，为进一步深入探索各种复杂事物奠定了坚实的基础。

2)洛仑兹有一套清晰的研究方法，《确定性非周期流》一文运用的一系列合理的“工作程序 ”，已被70年代末以来的混沌学家广泛采用。

3)定性的数学分析与计算机定量模拟相结合，开创了复杂性研究的新方法。在现在看来使用计算机是件平常的事，但在60年代初，这是不平凡的。特别是，他识破了复杂系统中“对初始条件的敏感依赖性”，能够正确地理解数值计算结果，显示了一位杰出科学家的洞察力。

苏联著名学者安德罗诺夫(A.A.Andronov，1901-1952)一生“工作在相平面上”，对非线性振动有深刻理解，但最终没有发现混沌，没有完成质的飞跃。关键性的一步似乎注定要让美洲的另一人来迈出。

1972年美国马里兰大学的费勒(A.Feller)教授在研究气象问题时偶然发现了洛仑兹1963年以及后来的几篇论文，他本人对洛仑兹的论文并不太感兴趣，虽然认为其中的观点很重要。费勒把洛仑兹的4篇论文一起交给了本校的数学教授约克。李天岩后来介绍，“若不是 Feller教授，我们不太可能有机会接触到它。那段时间，我们读了洛仑兹写的文章，觉得很有意思。”1973年4月的一天，约克告诉李天岩有一个好想法，即后来出了名的李-约克定理(Li-Yorke theorem)，大约两周后李天岩顺利证明出了此定理。论文寄到了《美国数学月刊》，不久被退了回来。编辑建议另投其他刊物或改得通俗一点。因为“月刊”不登专门的研究论文。约克坚持再寄回去，可李天岩一直没有去修改它，这样该论文在李的办公桌上躺了近一年。1974年是马里兰大学数学系的生物数学特别年，一次请普林斯顿大学赫赫有名的生物学教授罗伯特·梅来校演讲，最后一天讲到了生物学中非常重要的逻辑斯蒂模型：

f_r(x)=rx(1-x), x∈［0,1］, 0＜r＜4.

梅报告了当参数较小时此方程的迭代将导致周期倍分岔。特别地当r=4时，x 值在0和1之间跑来跑去，他无法解释这种现象，以为是计算误差造成的。约克立即意识到这些与李-约克定理有关，在送梅上飞机时约克给梅看了那篇未发表的论文，梅大吃一惊，他认为这个定理在很大程度上解答了他的疑问。约克从机场回来立刻跑到李天岩那里，说要马上改写那篇文章。结果“周期三蕴含混沌”刊登在了《美国数学月刊》1975年第12期上。梅到欧洲各处演讲，李约克定理也名扬天下，并且洛仑兹吸引子也被广为介绍，以前梅并不知道洛仑兹的工作。

9.4若斯勒混沌

1976年若斯勒对洛仑兹模型进行再建模，化简出一个新的方程组，仍然能够产生混沌。洛仑兹混沌吸引子是对称的，而若斯勒混沌吸引子丧失了对称性，整体结构颇像单侧曲面——麦比乌斯(A.F.Mobius,1790-1868)带。若斯勒方程的具体形式为
dx/dt=-y-z,
dy/dt=x+ay,
dz/dt=b+z(x-c)，其中a,b和c都是正的参数，方程中只含有一个非线性项z x，而洛仑兹方程含有两个非线性项。从形式上看若斯勒方程的确比洛仑兹方程简单。显然，这也是一个自治的常微分方程，右端不显含时间。先对系统作定性分析，将原系统划分为两个相互关联的子系统，第一个子系统由前两个方程代表，第二个子系统由第三个方程代表。当z足够小时，第一个方程中的z可以暂时忽略，这时第一个子系统可以暂时简化为
dx/dt=-y,
dy/dt=x+ay,
它实际上是一个二阶线性振子，将第一个方程代入第二个方程立即得到如下微分方程：
d^2x/dt2-a(dx/dt)+x=0.
学过振动理论的对此方程一定是非常熟悉的，当a为正数时，它代表负阻尼振子的振动情况。在相平面(x,y)上考虑问题，原点(0，0)是一个不稳定焦点(focus) ，轨线从原点附近向外盘旋，圈越转越大。大到一定程度，整个系统的非线性(在第三个方程中体现出来)就必须考虑了。非线性起什么作用呢?非线性限制了轨线无限制向外盘旋。如果没有非线性，轨线很快奔向无穷远处。非线性项的存在阻止了这一点。我们看第三个方程，当x大于c时，z的系数变正，取b为正值，这时第三个方程所代表的子系统变得不稳定。非线性项起作用的结果是z值增大，而z增大的结果又会导致x减小，因为z增大后，第一个方程中右端变小，以至于成为负值，于是x减小。x 逐步变小，以至于小于c，这样又会使z变小，相轨道逐渐落入( x,y)平面，并接近原点。这时第三个方程又是次要的了，第一个子系统起支配作用，轨道又向外盘旋，再升高，再收缩，再降低，等等。定性上分析，轨道运动大概就是这个样子：在(x,y)平面上拉伸，在z轴方向折叠。两个子系统奇妙地耦合在一起(通过非线性)，子系统的稳定性交替变化，相互制约。若斯勒系统的数值积分程序与洛仑兹系统的完全一样，没必要单独写出来。不过，现在要考虑另一件重要的事情：吸引子的任意投影。在此之前我们只能做XOY，XOZ，YOZ三个特殊方向上的投影，而这是很不够的。在计算三维微分方程系统时，得到三维数据(x ,y,z)，任意角度投影的思想就是将这三维数据压缩成两维，并使这两维的数据仍然包含原来三维数据的信息，也就是说想找到一种变换，使(x,y ,z)→(X_N,Y_N)，只要指定两个投影角度，就能顺利得出变换公式。设投影角度分别是θ和φ，则投影算法为：
X_N=xcosθ-ysinθ,
Y_N=xsinθsinφ+ycosθsinφ+ zcosφ,
Z_N=xsinθcosφ+ycosθcosφ- zsinφ.

9.5 布鲁塞尔子

从70年代末开始，在耗散结构(dissipative structures)的题目下，一个假想的三分子化学反应动力学系统就被广泛研究了，其中比利时布鲁塞尔自由大学普里高津(I.Prigogine,191 7- )教授领导的学派为此作出巨大贡献，于是这个模型被叫做布鲁塞尔模型。进入80年代，非线性动力学兴起，人们以混沌的眼光重新考察这个系统，加上一个三角函数策动项，得到受迫布鲁塞尔模型，生成的混沌吸引子遂被称为布鲁塞尔子(Brusselator)。1982年郝柏林和张淑誉(1933- )在《统计物理杂志》上著文《混沌带的层次结构》,详细讨论了布鲁塞尔三分子系统。1983年茹克斯(J.-C.Roux)等人在《Physica 8D》上著文《奇怪吸引子的观测》,从实际BZ反应(Belousov-Zhabotinskii reaction)数据中构造出奇怪吸引子。至此，非线性动力学方法已深入到理论化学与应用化学中去。

在科学史上，三分子化学反应动力学模型起过重要作用，它是耗散结构理论的一个重要组成部分。在那里人们用它来说明在开放系统中，如何通过分岔，由平衡到近平衡，再到远离平衡，以至最后出现耗散结构。但是单纯在耗散结构的框架中，人们始终未能清楚地说明究竟是什么起了关键性的作用。到了80年代，从非线性动力学角度看，事情才比较明朗：是非线性起关键作用，它引起系统远离平衡，出现新结构。非但如此，非线性动力学还阐述了细节过程，指出周期倍化分岔，周期骨架与混沌带的关系，找到了普适常数等，从而将这一特殊的方程，纳入更一般的非线性科学的理论与方法，使之成为其中的一个特例。这段历史展示了科学界的关注重点从非平衡到非线性的转移。

现在我们看受迫布鲁塞尔模型

dx/dt=A-(B+1)x+x^2y+α cos(ωt),
dy/dt=Bx-x^2y,

其中A,B,α和ω都是参数，第一个方程最后一项α cos(ωt)表示外部周期策动(如果去掉这一项就得到原始的布鲁塞尔模型)。这是一个非自治的二阶微分方程系统，因为右端显含时间。它等价于一个三阶的自治微分方程系统(可化成多种形式)。本节里，我们直接对其进行数值积分，而不是先把它化成自治系统。郝柏林的文章提到，为了提高计算速度，应避免多次计算三角函数，于是他们通过增加变量将原方程化成四阶方程再进行计算。那时候是80年代初，考虑计算速度是有道理的，而现在微机的速度都非常快(用486DX/80足矣!) ，根本不需要化二阶为四阶。

References