定义
在线性代数中,对于给定的方阵 A ,它的特征向量在该方阵经过线性变换后,所得到的新的向量与原来的向量在同一条直线上,即方向相同或刚好夹角呈 180° ,长度呈比例缩放,则这样的向量称为特征向量,这个比例称为特征值。
更标准地,给定一个向量空间 E ,从 E 到 E 自身的线性变换 T 是一个保持向量加法和标量乘法这两种运算的函数,例如旋转、反射、错切、压缩,或者这些变换的组合等等。一个线性变换可以通过它们在向量上的作用来可视化。一般来说,一个向量在经过映射之后可以变成任何可能的向量,而特征向量具有更好的性质。
一个线性变换 T:E→E 的特征向量 v 是一个非零向量且在这个线性变换下的新向量为 v 简单地乘以一个标量 λ 。也就是说存在一个标量 λ 使得 v满足下式:
T(v)=λv
其中的缩放因子 λ 称为这个特征向量的特征值,或者说是线性变换 T 的特征值。反过来,一个实数 λ 是线性变换 T 的一个特征值,当且仅当有一个非零向量 v 满足上面的式子。
所有具有相同特征值 λ 的特征向量与零向量一起,组成了一个向量空间,称为线性变换的一个特征空间,一般记作 Eλ(T) 。这个特征空间如果是有限维的,那么它的维数叫做 λ 的几何重数。
变换的主特征向量是模最大的特征值对应的特征向量。有限维向量空间上一个变换的谱是其所有特征值的集合。
特征向量也可以看做是关于系数 λ 的方程:
T(x)=λx
的非零解。显然只有在 λ 是变换 T 的特征值之时,方程才有非零解。
计算
特征方程
对于一个线性变换 T ,其可由矩阵 A 表示,则有特征方程:
Av=λv
移项得:
(A−λI)v=0
由于 v=0 ,这意味着 A−λI 必须不可逆,即:
det(A−λI)=0
这个关于 λ 的方程叫做特征方程。
多项式 p(λ)=det(A−λI) 叫做特征多项式
由特征方程可以求解得到 λ 的值,从而对每个特征值 λi ,求解齐次线性方程组:
(A−λiI)v=0
得到的基础解系的非零线性组合就是属于 λi 的全部特征向量。
重要性质与计算技巧
特征值与矩阵运算
∙tr(A)=λ1+λ2+λ3+⋯+λn (迹 = 特征值之和)
∙det(A)=λ1λ2λ3…λn
∙A 可逆 ⇔ 所有特征值非零
∙ ,若 A 可逆,则 A−1 的特征值是 λi1 ,特征向量相同。
∙Ak 的特征值是 λik ,特征向量相同。
∙ A 和 A 的转置 AT 的特征值相同。A 的特征多项式和 AT 相同。
∙ 多项式 p(A) 的特征值是 p(λi) ,特征向量相同。
特殊矩阵的特征值
∙ 对角矩阵:特征值就是对角元
∙ 三角矩阵:特征值也是对角元
∙ 实对称矩阵:特征值全是实数,不同特征值对应的特征向量正交
∙ 正交矩阵:特征值的模长 ∣λ∣=1
∙ 幂等矩阵(A2=A ):特征值只能是 0 或 1
∙ 对合矩阵(A2=I):特征值只能是 1 或 -1
特征值与相似
若 A=PBP−1 ,则 A 与 B 特征值相同,特征向量满足:若 B 有特征向量 u ,则 A 有特征向量 Pu
注意事项
1.特征向量必须非零。
2.一个特征值对应的特征向量有无限多个(构成特征子空间)。
3.重特征值的特征子空间维数可能小于代数重数,此时矩阵不可对角化。
4.不同特征值对应的特征向量线性无关,所以不同特征值对应的特征空间维数加起来 ≤n