因此它有两个等价的定义式:
式子右边的这个极限如果存在,则导数存在,那么函数在该点可导。
而可微性的定义则比上式要复杂的多,它要用得到高阶无穷小的概念:
可以看出,可微性的定义与可导性是截然不同的,因此二者是完全不同的两个概念,千万不要把它们混在一起。
为了进一步弄清二者之间的区别,大家需要深刻地理解可微性这一概念。很多人对上面这个式子看得莫名其妙,那是因为不了解其背后的几何含义,大家来详细介绍一下。
微积分的发明最初是源于牛顿思考如何求变速运动的瞬时速度这一问题。他采用的是极限的思想,当然这种思想并非牛顿的首创,古希腊伟大的数学家、物理学家阿基米德,就采用过类似的方法。
他当时思考的是如何求一个圆形的面积,现在大家已经知道了,是利用内接正多边形来逼近圆的方法,当边数越多面积就越接近于圆的面积,当边数多到无限多的时候,也就是对边数求一个极限,那就可以得到圆的整个面积:
这是偶国古代数学家祖冲之计算圆周率,用的也是类似的方法。这一类方法包含了一个深刻的思想就是,在一个很小的范围之内,曲线就约等于一条直线:
那么大家定义函数在一点可微用的也是这个思想,可以参见下面这个图
大家研究函数在x=a这一点的性态。首先按照刚才的思想,大家在x=a这一点附近做一条直线,让它尽可能地贴近这条曲线,注意!偶这里可没有说是做一条切线,具体是做什么样的直线目前还不知道,于是大家就想知道,当它的斜率取为多少的时候,可以做到“尽可能地贴近”。
那大家就需要来分析一下什么叫做“尽可能地贴近”,大家把这条直线的斜率记成A,来研究一下函数在x=a+Δx这一点,函数在这一点的取值是f(a+Δx),那么它与x=a这一点的函数值之差就是f(a+Δx)-f(a),就是图中所表示的Δy。同时直线上在这一点的取值与在x=a处的取值之间的差大家用dy来表示。
大家来计算一下dy究竟等于什么,大家知道斜率的计算公式就是(y₂-y₁)/(x₂-x₁),按照图中所示,其实就是dy/Δx,这里需要注意一下,Δx就是dx,而大家已经设出直线的斜率是A,因此dy就等于AΔx。
知道了Δy与dy,那么“尽可能地贴近”的意思就是指,Δy与dy之间的差值,即误差Δy-dy,尽可能地小。按照大家刚才给出的式子,Δy-dy就等于f(a+Δx)-f(a)-AΔx,这就是可微式定义中的分子部分。
那么问题又来了,什么叫做误差尽可能的小呢,从图上可以看出,不管你直线的斜率取成什么样子,当Δx越小的时候,误差肯定也就越小。这样一来不同的直线之间就无法区分开,因此大家把条件再加强一点。大家不仅要求误差越来越小,还要求它是一个关于Δx的高阶无穷小。如果大家能找到适当的A,使得它满足这一点,那么大家就说这条直线是最“尽可能贴近”的一条直线。而高阶无穷小的定义大家在高等数学中都已经学过,就是二者的比值当Δx趋近于0的时候极限也是0,于是偶就写出了刚才提到的那个可微性的定义的表达式。
偶想,明白了这个原理,大家也就可以理解可微性的真正内涵,也就可以清楚的认识到,它与可导性是完全不同的两个概念。
那么,可微性与可导性之间又有什么样的联系呢?二者是相互等价的,即若f(x)在x=a处可导,则可以推出来它在a处是可微的;反过来,如果它在这一点可微则可以推出来它在这一点可导。大家来证明一下这两个结论。
- 定理1:若f(x)在x=a处可导,则它在x=a处可微
这就是大家可微性的定义,因此可以推出来函数在这一点是可微的。
反过来
定理2:若f(x)在x=a处可微,则它在x=a处可导。
上面的两个定理可以看出,可导性和可微性是有密切联系的,二者不仅互相等价,而且可导性中的导数实际上就相当于可微性定义里的那个A。这就是为什么经常会有人说二者是一回事,但实际上从严格的数学角度来看,二者是完全不同的。
当然,上面是针对于一元函数的情形;而对于多元函数,z=f(x,y),结论就不一样了,可导与可微甚至都不是等价的。
多元函数的情形
对于多元函数,大家拿二元函数z=f(x,y)举例子,研究它在(a,b)这一点的情况。因为平面上有无数多个方向,因此大家需要研究它的偏导数,对x的偏导和对y的偏导,对x的偏导定义就是将y值固定为b,对x求导数,它的严格数学定义式是
它的几何解释就是对这个曲面在y=a处做一个横截面,截口就是一条曲线,这个曲线在x等于a处切线的斜率,如下图所示
同样在这一点关于y的偏导就是
它的几何解释就是,在x=a处做切面截出的曲线在y=b处的切线斜率,如下图所示
同样的,大家可以定义在(a,b)这一点处函数的可微性,大家同样是利用“化曲为直”的思想,二元函数的图像是一个曲面,因此这里大家是用一个平面来代替曲面,即,过f(a,b)这一点做一条尽量的贴近曲面的平面,参考一元函数的情形,大家可以画出如下图像
大家的目标也是想让函数值与平面上的值之间的误差是一个关于自变量变化的无穷小量。而自变量的变化又分成两部分,x的变化是Δx,y的变化是Δy,新旧两点之间的距离就可以利用勾股定理,即两条直角边的平方和再开方而得到,遵循同样的道理,大家可以写出函数在一点可微的定义:
可以看出,在多元函数中,一点处可导与可微之间的差异表现的就更明显了。
二者甚至都不是等价的,大家有如下结论。首先,如果可微的话,那么两个偏导数必然存在,这是一定的。
定理3:若f(x,y)在(a,b)处可微,则在该点处,关于x和y的两个偏导数都存在
于是大家有类似的结论,可微的函数不仅两个偏导数存在,并且关于x的偏导数就是定义里的A,关于y的偏导数就是定义里的B。
但是这个结论反过来就不一定成立了:即使两个偏导数都存在,那么在这一点也有可能不可微,以下是一个例子。
所以在多元函数中,可导与可微并不等价,这就告诉大家就更有必要将可导与可微给区分开了。但是大家有如下的定理:
定理4:函数f(x,y)的两个偏导数在点(a,b)的某个领域内存在,并且两个偏导函数在该点处连续,那么函数在这点可微
这个条件只是函数在一点可微的充分条件,它的证明过程比较复杂,需要使用拉格朗日中值定理,如果有兴趣的读者可以参阅相关教材。
到这里大家就基本把可导与可微的关系说清楚了,但是数学家们会研究更复杂的函数——向量函数,而它的可导性与可微性形式就更复杂了,但是思想核心还是一样的。
3.向量函数的情形
所谓向量函数,通俗的讲就是自变量与因变量都是向量的函数。一般的,它把一个n维向量映射到一个m维向量,通用的表达方式如下:
有时为了形式上的好看,大家把向量竖过来写:
所以一个由n维向量映射到m维向量的向量函数,实质就是m个n元函数。当向量维数比较高的时候,大家无法画出它的图形,但是当向量维数为二维或者三维的时候,它是有几何含义的。比如从二维到二维的向量函数,它的自变量x可以理解为平面上的一个位置,y表示一个向量,因此二维到二维的向量函数可以理解为给平面上每一个点赋予一个向量,比如下图所示
上面就是三个二维到二维向量函数的例子。同样三维到三维的向量函数相当于给空间中每一点赋予一个三维向量,比如下面几个例子
上面两种向量函数,大家分别称为二维向量场与三维向量场,向量场是物理学问题中的一个重要的研究工具,力场,磁场,电场等等都是某种特殊的向量场。向量场在流体力学中有着基础性的地位。
上图展示的是美国旧金山地区在2010年5月1日早上6点时的空气运动
上图是加拿大新苏格兰岛附近某时刻的海水流动
飞机运行中的风洞测试也是三维向量场
因为向量函数涉及多个函数与多个自变量,因此它的导数就比较麻烦,大家需要研究每一个函数关于每一个自变量的偏导数,这样一来,大家就需要用矩阵来表示
上面这个矩阵大家就称为导数矩阵,当然有一个更专业的名字叫做雅可比矩阵(JacobianMatrix)。
卡尔·雅可比(CarlGustavJacobJacobi,1804~1851),德国数学家。
雅可比矩阵其实就是导数的多维推广,如果一个向量函数在某一点处所有函数关于所有分量的偏导数都存在,那么称它的这一点是可导的,并且它的导数就是雅可比矩阵。
将一元函数导数推广为多维就成了雅克比矩阵,同样可微性大家也是做类似的推广。大家也是希望因变量的误差值是一个关于自变量变化值的高阶无穷小,而这是因为自变量的变化只是一个向量,因此大家就需要有一个常数矩阵A,即有如下定义,若存在n×m的常数矩阵,使得向量函数满足
那么大家就说该函数在a这一点是可微的。
同样道理可导的话,大家推不出可微来,但是可微的话一定可以推出各个偏导数都存在,同时雅可比矩阵就是可微性定义里边的那个矩阵A。
4.结论
好了,通过上面的一系列论述过程,大家可以体会到两点。第一,可导和可微是完全不同的两个概念,切不可混为一谈。细节体现功底,对相近概念之间差别的认识,充分反映了一个人的数学知识水平。第二,推广是数学中很重要的一个思想,大家的可微性,也是经历了一个由一元函数向多元函数,再向向量函数推广的过程。理解并自觉的运用推广这种思想,对学习数学有着非常大的帮助。
参考文献
[1]《高等数学》,第七版,同济大学数学系,北京,高等教育出版社
[2]《流形和STOKES定理》,徐森林,人民教育出版社
[3]《数学分析(下册)》,第三版,华东师范大学数学系,北京,高等教育出版社
[4]Calculus,earlytranscendentals,11ed,HowardAnton,IrlBivens,StephenDavis,JOHNWILEY&SONS,INC
[5]Calculus,earlytranscendentals,7ed,JamesStewart,Brook/COLE