漫步最优化十一——局部极小与极大的充分必要条件(上)

时间:2024-04-01 17:44:51


便






——

梯度g(x)与海森矩阵H(x)在局部极小值点x上必须满足某些条件,两个条件集如下:

  1. 在局部极小值点x处必须满足的条件,他们是必要条件。
  2. 保证x是局部极小值点点条件,他们是充分条件。

充分必要条件可以用许多定理的形式进行描述,这些定理中使用比较广泛的概念就是可行方向的概念。

1δ=αdx上的变化量,其中α是正常数,d是方向向量,如果R是可行域且存在常数α̂ >0使得对所有α,x+αdR,其中0αα̂ ,那么称d为点x的可行方向。

效果上,如果点x沿方向d移动有限的距离后依然在R中,那么d就是x的可行方向向量。

1优化问题的可行域为

R={x:x12,x20}

如图1所示,对于点x1=[4 1]T,x2=[2 3]T,x3=[1 4]T,向量d1=[2 2]T,d2=[0 2]T,d3=[2 0]那个是可行方向?

α̂ =1,在0αα̂ 范围内的所有α

x1+αd1R

d1是点x1处的可行方向;对任意0αα̂ 

x1+αd2Rx1+αd3R

因此d2,d3x1的可行方向。

因为不存在常数α̂ >0使得

x2+αd1Rfor 0αα̂ 

,所以d1不是x2处的可行方向。另一方面,存在正数α̂ 使得对0αα̂ 而言

x2+αd2Rx2+αd3R

,所以d2,d3x2的可行方向。


漫步最优化十一——局部极小与极大的充分必要条件(上)
图1

因为x3不在R中,所以不存在α̂ 是的对任意的d

x3+αdRfor 0αα̂ 

,因此d1,d2,d3不是x3的可行方向。


目标函数要想有极小值,必须满足里两个条件,也就是一阶与二阶条件,一阶条件是一阶导数的形式,如梯度。

1极小值的一阶必要条件。

  • 如果f(x)C1,x是局部最小值点,那么对于x处的所有可行方向
    g(x)Td0
  • 如果xR的内点,那么
    g(x)=0

(a)如果dx的可行方向,那么

x=x+αdRfor 0αα̂ 

利用泰勒级数

f(x)=f(x)+αg(x)Td+o(αd)

如果

g(x)Td<0

那么当α0

αg(x)Td+o(αd)<0

那么

f(x)<f(x)

这与假设x是极小值相矛盾,因此x为极小值的必要条件是

g(x)Td0

(b)如果xR的内点,所有可行方向的向量均存在,那么由(a)可知,向量d=d1产生

g(x)Td10

同样的,对于方向d=d1

g(x)Td10

因此在这种情况下,x是极小值的必要条件是

g(x)=0


二阶必要条件涉及到一阶与二阶导,或者等价的梯度与海森矩阵。

1

  • d是点x处的任意方向向量,如果对任意的d0,dTHd>0,0,0,<0,那么称二次项dTH(x)d为正定,半正定,半负定,负定。如果dTH(x)d既可以为正也可以为负,那么称其为不定的。
  • 如果dTH(x)d是正定,半正定等,那么称矩阵H(x)为正定,半正定等矩阵。