这是一个开放性问题,不同的人可能有不同的看法,小石头接下来谈的仅仅是自己的看法。
一个m×n矩阵形式如下:
是由m×n个元素组成的阵列。大家规定组成同一个矩阵的元素必须来自于同一个域F(当F=实数域R时,称为实矩阵,当F=复数域C时,称为复矩阵),并将F上的全体m×n矩阵记为M_{m,n}(F)。
对于来自同一个域并且左矩阵的列数=右矩阵的行数的m×n矩阵A∈M_{m,n}(F)和n×s矩阵B∈M_{n,s}(F)定义矩阵乘法:
乘法的结果为一个m×s矩阵C∈M_{m,s}(F)。
(可以很容易推导出:矩阵乘法具有结合律,不具有交换律,这与数域内的乘法运算的性质不同。)
当B的列为1时,其退化为一个n维列向量v,这时矩阵乘法解结果C也退化为m维列向量u:
这相当于m×n矩阵A借助于矩阵乘法将n向量空间(记为Fⁿ)中的任意元素v映射为n向量空间(记为Fᵐ)中元素u,也就是说A是Fⁿ到Fᵐ的映射,记为,
再进一步,大家还发现:
以及,
即,A具有如下性质:
- A(v+v’)=A(v)+A(v’)
- A(kv)=kA(v)
称具有这样性质的A为线性映射。
小结论1:F上的m×n矩阵A∈M_{m,n}(F)是向量空间Fⁿ到Fᵐ的线性映射A:Fⁿ→Fᵐ。
根据小结论1,除了A外,式(1)中的n×s矩阵B和m×s矩阵C则分别是线性映射B:Fˢ→Fⁿ和C:Fˢ→Fᵐ,于是对于任意s维列向量v都有,
从这个等式中,大家马上就可以发现:矩阵乘法相当于线性映射的复合,绘制如下图:
小结论2:同一个域F上的m×n矩阵A和n×s矩阵B之间的乘法本质是线性运算A和B的复合。
下面大家用二维平面R²上的线性变换(同一个空间上的映射特称变换),来说举例说明以上结论。
◆将R²上的任意一个点(x,y)沿着X和Y方向分别缩放s_x和s_y倍得到(s_xx,s_yy)的比例变换定义为:
设,比例变换S₁和S₂的缩放比例分别是s¹_x,s¹_y和s²_x,s²_y,于是任意点先经过S₁缩放再经过S₂缩放最终比例一定是s¹_xs²_x,,s¹_ys²_y。大家再看矩阵乘法:
矩阵乘法结果S₂S₁的缩放比例是s¹_xs²_x,,s¹_ys²_y这和上面的S₁和S₂的变换复合结果一致。
◆更复杂的变换是将点(x,y)以原点为中心逆时针旋转θ度变为(x’,y’)的旋转变换R。根据中学平面几何和三角函数的知识,有:
于是,R定义为:
设,R₁和R₂是分别逆时针旋转θ₁和θ₂的旋转变换,则它们的复合显然是逆时针旋转θ₁+θ₂。大家看它们对应矩阵的乘法:
显然,矩阵乘法结果R₂R₁是一个逆时针旋转θ₁+θ₂的旋转变换,这与R₁和R₂的复合结果一致。
综上,得出最终结论:
矩阵的本质是线性映射,矩阵乘法的本质是线性映射的复合。
(顺便多说一点)
前面的小结论1,反过来也成了,也就是说:向量空间上任意一个线性映射f:Fⁿ→Fᵐ都对应一个矩阵。
设,单位向量为e₁=(1,0,…,0),e₂=(0,1,…,0),…则Fⁿ中任意向量v=(v₁,v₂,…,v_n)可以表示为:
v=v₁e₁+v₂e₂+…+v_ne_n
再根据f线性性质,有,
f(v)=f(v₁e₁+v₂e₂+…+v_ne_n)=v₁f(e₁)+v₂f(e₂)+…+v_nf(e_n)
设,
f(e₁)=(a₁₁,a₂₁,…,a_m₁),f(e₂)=(a₁₂,a₂₂,…,a_m₂),…,f(e_n)=(a₁n,a₂n,…,a_mn)
则有,
可见,f和矩阵A对应。
(从以上分析可以看出:矩阵以及矩阵乘法的由来,它们不是凭空产生的数学概念,而是基于对线性映射的研究自然导出的结果。)