线性映射和雅可比矩阵
一般的,我们将n维空间中的向量记为xn×1,m维空间中的向量记为ym×1,n维空间的向量可以通过线性映射转化到m维空间
y=Am×nx
矩阵Am×n即为雅可比矩阵
Am×n=[∂x1∂f∂x2∂f⋯∂xn∂f]
Am×n=∂x1∂f1∂x1∂f2⋮∂x1∂fm∂x2∂f1∂x2∂f2⋮∂x2∂fm⋯⋯⋱⋯∂xn∂f1∂xn∂f2⋮∂xn∂fm
为了与一般准则保持一致,我们使用J来表示雅可比矩阵,其分量可表示为
Ji,j=∂xj∂fi
雅可比矩阵推导
方阵
在推导雅可比矩阵前,我们要先了解两个数学概念之间的不同:函数与映射
根据《数学分析》中的概念:
Rm—>R的这类映射我们称之为函数,Rm—>Rn的这类映射我们称之为广义的映射
函数
根据上述的概念,我们可知函数是一种特殊的映射,其将m维空间的向量映射为一个具体的数值
在函数领域,我们写出一般情况下的泰勒展开公式
一元函数的泰勒展开式:
f(x)=f(xk)+(x−xk)f′(xk)+2!1(x−xk)2f′′(xk)+o((x−xk)2)
二元函数的泰勒展开式:
f(x,y)=f(xk,yk)+(x−xk)fx′(xk,yk)+(y−yk)fy′(xk,yk)+2!1(x−xk)2fxx′′(xk,yk)+2!1(x−xk)(y−yk)fxy′′(xk,yk)+2!1(y−yk)2fyy′′(xk,yk)+on
n元函数的泰勒展开式:
。。。
将泰勒展开写成矩阵形式:
f(x)=f(xk)+[∇f(xk)]T(x−xk)+2!1[x−xk]TH(xk)[x−xk]+on
如果我们忽略泰勒展开中的高阶项,那么
f(x)≈f(xk)+[∇f(xk)]T(x−xk)
可进一步得到:
Δf=[∇f(xk)]TΔx(1)
其中,Δf和Δx的维度相同,将其转换成微分的形式,结合微分与梯度中多元函数微分的形式更好地理解
df(x1,x2,...,xn)=[∂x1∂f∂x1∂f∂x2∂f⋯∂xm∂f]dx1dx2⋮dxm(*)
映射
映射相比函数而言更为普适,其代表m维空间向n维空间的映射,即将一个m维的向量映射为一个n维的向量函数
对照公式* ,我们把等式左侧的单一值函数微分变为由m个函数微分组成的向量函数微分,该向量函数微分的每个分量函数微分都是由n 维向量x的微分与对应函数偏导的内积映射而来,共有m个函数微分,故单一值函数的多元函数微分映射关系被执行了m次,有:
df1df2⋮dfm=∂x1∂f1∂x1∂f2⋮∂x1∂fm∂x2∂f1∂x2∂f2⋮∂x2∂fm⋯⋯⋱⋯∂xn∂f1∂xn∂f2⋮∂xn∂fmdx1dx2⋮dxn
对等式左右两侧的微分作积分,即可得到一般形式下的n维向量向m维向量映射的关系式:
f1f2⋮fm=∂x1∂f1∂x1∂f2⋮∂x1∂fm∂x2∂f1∂x2∂f2⋮∂x2∂fm⋯⋯⋱⋯∂xn∂f1∂xn∂f2⋮∂xn∂fmx1x2⋮xn