Logo
0

nn元函数微分

👨‍🏫对于一个nn元函数f(x1,x2,...,xn)f(x_1,x_2,...,x_n) ,有:

df(x1,x2,...,xn)=fx1dx1+fx2dx2+...+fxndxndf(x_1,x_2,...,x_n)=\displaystyle\frac{\partial{f}}{\partial{x_1}}dx_1+\displaystyle\frac{\partial{f}}{\partial{x_2}}dx_2+...+\displaystyle\frac{\partial{f}}{\partial{x_n}}dx_n

其中,df(x1,x2,...,xn)df(x_1,x_2,...,x_n)为该nn元函数f(x1,x2,...,xn)f(x_1,x_2,...,x_n)的全微分

👉全微分的本质:对于nn元函数f(x1,x2,...,xn)f(x_1,x_2,...,x_n) 而言,在nn维空间中的一点(x1,x2,...,xn)(x_1,x_2,...,x_n)上,各个维度单位(极其微小的)变化Δxi,i{1,2,...,n}\Delta{x_i},\forall i \in \{1,2,...,n\} 所引起的函数值变化Δf(x1,x2,...,xn)\Delta{f(x_1,x_2,...,x_n)}

nn元函数梯度

nn元函数含有nn个维度,因此求该函数的梯度时会涉及到nn个方向,每个方向的梯度为一次导数fxi\displaystyle\frac{\partial{f}}{\partial{x_i}},代表其他方向不变,该方向上单位各方向的梯度构成梯度向量

f=(fx1,fx2,fx3,...,fxn)T\nabla{f}=(\displaystyle\frac{\partial{f}}{\partial{x_{1}}},\displaystyle\frac{\partial{f}}{\partial{x_{2}}},\displaystyle\frac{\partial{f}}{\partial{x_{3}}},...,\displaystyle\frac{\partial{f}}{\partial{x_{n}}})^\mathrm{T}

值得注意,梯度向量指的是各维度上单位变化引起的函数值变化,而这个单位为各维度微分,我们将其称为微分向量

dx=(dx1,dx2,...,dxn)d\mathbf{x}=(dx_1,dx_2,...,dx_n)

🧠注意,梯度向量和微分向量的内积即为上述nn元函数全微分

💡因此,nn元函数微分本质上为该函数在nn维空间中某点沿梯度的增长率,也可以理解为在这一点处综合梯度与坐标轴方向,使用梯度来逼近函数在该点的趋势

柯西不等式

nn维空间存在向量A\mathbf{A}和向量B\mathbf{B} ,则有:

ABAB\mathbf{A}\cdot\mathbf{B}\leq|\mathbf{A}||\mathbf{B}|

原理很简单:

AB=ABcosθ\mathbf{A}\cdot\mathbf{B}=|\mathbf{A}||\mathbf{B}|\cos{\theta}

三角函数恒小于等于1,故柯西不等式成立

为什么梯度是函数上升最快的方向

⛱ 易知,微分向量梯度的模是固定的,而梯度的方向为沿各维度/坐标轴的正向,因此梯度和微分向量之间的夹角为0,cosθ=1\cos\theta=1,梯度方向是函数上升最快的方向

  • 若选择和梯度相同方向的向量,则该向量与上述微分向量的内积为为两向量模乘积,根据柯西不等式,可知该情况可使函数上升最快
  • 若选择和梯度不同方向的向量,则该向量与上述微分向量的内积为两向量模乘积再乘以一个cosθ\cos\theta,其必然小于等于沿梯度的变化率(如果和梯度垂直,则cosθ\cos\theta取0,即不发生任何变化,与梯度反向,则cosθ\cos\theta取-1,即下降速度最快)

Pasted image 20240212151830.png#pic_center ❓为什么梯度方向和函数等高线的切线垂直? 👉以f(x,y)f(x,y)为例,设该函数上的某条等高线为f(x,y)=cf(x,y)=c ,则其上一点(x0,y0)(x_0,y_0) 的切线斜率为:

dydx=fxfy\displaystyle\frac{dy}{dx}=-\displaystyle\frac{f'_x}{f'_y}

上面公式由多元隐函数求导得出:

fx+fydydx=0f'_x+f'_y\displaystyle\frac{dy}{dx}=0

因此法线斜率为:

k=fyfxk=\displaystyle\frac{f'_y}{f'_x}

梯度的表达式易知为:

(fx,fy)(\displaystyle\frac{\partial{f}}{\partial{x}},\displaystyle\frac{\partial{f}}{\partial{y}})

因此梯度的斜率为:

fyfx=fyfx\displaystyle\frac{\displaystyle\frac{\partial{f}}{\partial{y}}}{\displaystyle\frac{\partial{f}}{\partial{x}}}=\displaystyle\frac{f'_y}{f'_x}

由此可知梯度的斜率与法线斜率一致,因此梯度与等高线的切线垂直 Pasted image 20240212163344.png 💁此外,等高线越密的地方,梯度的模越大,越稀疏的地方,梯度的模越小 这个结论比较好理解,如果固定步长,那么梯度的模越大,则函数值变化越大,即会跨越更多条等高线,反之则跨越较少条等高线

© 2025 All rights reservedBuilt with DataHub Cloud

Built with LogoDataHub Cloud