惯例开场故事
在某次从实验室去往食堂的路上,曾发生这样一段对话:
『大师兄,为什么你对算法的理解总是那么透彻呢?为什么我很难看出它背后的思想?』
『因为你去理解一个算法的时候,不能只是看懂它的形,还要去思考它的神啊~』
这就是我天分不够当不了科学家的佐证吧T。T
从二次型最优化来理解
最小化二次型目标函数,其中A为已知的实对称二阶矩阵,,.这个问题的求解很简单,这里以此为例来说明该问题与矩阵特征值的关系。
首先,可以得到目标函数的网格图与等高线图如下。
对矩阵A进行特征分解可以得到其特征向量为[-0.7071, 0.7071], [0.7071, 0.7071],对应的特征值分别是0.5, 1.5.
观察函数的等高线图可以知道,等高线最密集的地方,函数值变化最快,而这个函数值变化最快的方向归一化后就是[0.7071, 0.7071],这恰好是矩阵的一个特征向量。同样地,可以观察,等高线最稀疏的地方,函数值变化最慢,变化方向则是矩阵的另一个特征向量。可以看出,矩阵特征值的大小与函数值的变化快慢有关
,较大特征值所对应的特征向量方向上函数值的变化较快,较小特征值所对应的特征向量方向上函数值的变化较慢。
进一步,对于实对称矩阵,我们总是可以对其进行相似变化,得到一个以该矩阵特征值为对角线元素的对角阵。,其中,P为正交矩阵,有性质P的逆等于P的转置。把目标函数改写为,其中. 相似变换的作用可以理解为将等高线图进行旋转,于是得到下面经过旋转后的等高线图。
在这张图上说明矩阵特征值的意义。当函数值取1时所对应的椭圆等高线的长轴长度为, 即由矩阵特征值0.5决定。同理,该椭圆短轴长度为,由矩阵特征值1.5决定。
二阶矩阵的理解较为直观。高阶矩阵的道理是一样的。
资料
【1】如何理解矩阵特征值