Ch 8 Generalized Eigenvectors and Jordan Form · Axler 4e · pp.260–294

当 Ch 5D 的"可对角化"失败时(经典反例:剪切 $\bigl(\begin{smallmatrix}1&1\\0&1\end{smallmatrix}\bigr)$),我们并非束手无策——只是需要更弱的基。Jordan 形给出最接近对角的标准形:不可对角化世界的谱定理。核心机制是把"特征向量"放宽成"广义特征向量"$\operatorname{null}(T - \lambda I)^k$,让每个 $\lambda$ 都对应一个真正能撑起"代数重数维"子空间的 $G(\lambda, T)$。

0 · 符号对照

符号念作含义类型
$V$, $T$V, T有限维复向量空间(本章主要在 $\mathbf{C}$ 上);$T \in \mathcal{L}(V)$空间 + 算子
$\lambda$lambda$T$ 的特征值:$\exists v \neq 0, Tv = \lambda v$$\mathbf{F}$ 中的数
$E(\lambda, T)$$\lambda$ 的特征空间$\operatorname{null}(T - \lambda I)$(Ch 5 的主角)$V$ 的子空间
$G(\lambda, T)$$\lambda$ 的广义特征空间$\operatorname{null}(T - \lambda I)^{\dim V}$(8.10 定义)$V$ 的子空间
广义特征向量generalized eigenvector$G(\lambda, T)$ 中的非零向量——存在 $k$ 使 $(T-\lambda I)^k v = 0$向量
幂零算子nilpotent$N \in \mathcal{L}(V)$,$\exists k \geq 1$ 使 $N^k = 0$(8.16)特殊算子
$J_n(\lambda)$$n$ 阶 Jordan 块$\lambda$ 在对角,上对角线全 1,其他 0:$\lambda I + $ 幂零$n \times n$ 矩阵
Jordan 标准形Jordan canonical formJordan 块沿对角线直和:$\bigoplus J_{n_i}(\lambda_i)$(8.60)矩阵标准形
代数重数algebraic multiplicity$\dim G(\lambda, T)$ $=$ $\lambda$ 在特征多项式中的重数(8.26)整数 $\geq 1$
几何重数geometric multiplicity$\dim E(\lambda, T)$ $=$ Jordan 块个数(对应 $\lambda$)整数 $\geq 1$
$p_T(z)$特征多项式$p_T(z) = \prod_i (z - \lambda_i)^{d_i}$,$d_i = \dim G(\lambda_i, T)$(8.27)$z$ 的多项式
$m_T(z)$最小多项式唯一首一多项式使 $m_T(T) = 0$ 且次数最低(5.27)$z$ 的多项式
$\bigoplus$直和$V = G_1 \oplus \cdots \oplus G_m$:每个 $v$ 唯一分解子空间关系
Cayley-HamiltonC-H 定理$p_T(T) = 0$:每个算子被自己的特征多项式零化(8.37)定理
颜色约定 特征方向 $E(\lambda, T)$ · 广义但非特征 $G \setminus E$ · 普通向量 · 幂零方向/病态

为什么需要 Jordan 形?5D 的可对角化不是够了吗?

不够。Ch 5D 给出了可对角化的五等价判据(5.55),但不是每个算子都满足。经典反例:剪切

$T = \begin{pmatrix}1 & 1 \\ 0 & 1\end{pmatrix}$

它的特征多项式 $p(\lambda) = (\lambda - 1)^2$ 把 $\lambda = 1$ 算作重数 $2$,但特征空间 $E(1, T) = \operatorname{span}\{(1, 0)\}$ 只有 1 维——"缺一个特征向量"。在实数或复数域上都无法找到第二个线性无关的特征向量,所以 $T$ 不可对角化。

然而 $T$ 并非"无结构可谈"——它确实 有一个标准形:它自己就是一个 Jordan 块 $J_2(1)$。Jordan 定理断言:

Jordan 定理(8.60,口语化). 对任何复向量空间上的算子 $T$,总能找到一组基,使 $T$ 在这组基下的矩阵是若干 Jordan 块 沿对角线堆叠的形状 $\operatorname{diag}(J_{n_1}(\lambda_1), J_{n_2}(\lambda_2), \ldots)$。

几何上:当特征向量"不够用"时,我们放宽——只要求 $(T - \lambda I)^k v = 0$ 对某个 $k$ 成立(而不必 $k = 1$),就叫广义特征向量。这样每个 $\lambda$ 都能凑齐它的"代数重数维"那么多的广义特征向量,拼起来必然够用。

一句话总结:Ch 5D 把"有特征基"叫可对角化;Ch 8 证明"总有广义特征基",代价是矩阵不再纯对角,而是"对角 + 上邻 1"的 Jordan 块。


广义特征空间 $G(\lambda, T)$ 到底是什么?

8.10 定义(广义特征空间). 设 $T \in \mathcal{L}(V)$,$\lambda \in \mathbf{F}$。$\lambda$ 对应的广义特征空间为 $$ G(\lambda, T) \;=\; \operatorname{null}(T - \lambda I)^{\dim V}. $$ $G(\lambda, T)$ 中的非零向量称为 $\lambda$ 的广义特征向量

对比常规特征空间 $E(\lambda, T) = \operatorname{null}(T - \lambda I)$:特征向量要求 $Tv = \lambda v$ 一步到位;广义特征向量则允许多步——存在 $k$ 使 $(T - \lambda I)^k v = 0$。所以 $E(\lambda, T) \subseteq G(\lambda, T)$,严格包含当且仅当 Jordan 块存在。

为什么指数取 $\dim V$? 因为零空间链稳定下来:

$\{0\} = \operatorname{null}(T - \lambda I)^0 \subseteq \operatorname{null}(T - \lambda I)^1 \subseteq \operatorname{null}(T - \lambda I)^2 \subseteq \cdots$

Axler 8.4 证明这条链最多在第 $\dim V$ 步就稳定(之后不再增大)。所以"到 $\dim V$ 次"足够,取更大的次数结果相同。

剪切例子:$T = \bigl(\begin{smallmatrix}1&1\\0&1\end{smallmatrix}\bigr)$,$\lambda = 1$。

广义特征空间把"不够用的 $E$"补齐到代数重数那么大,这就是 Jordan 能绕过剪切的根本。

8.13 命题. 对每个 $\lambda$:$E(\lambda, T) \subseteq G(\lambda, T)$,且 $G(\lambda, T)$ 是 $T$-不变子空间($T$ 作用后仍在里面)。

关键分解:$V = G(\lambda_1, T) \oplus \cdots \oplus G(\lambda_m, T)$

Ch 8 的主命题,等价于 Jordan 定理的"空间版本":

8.21 广义特征空间分解定理. 设 $V$ 是有限维复向量空间,$T \in \mathcal{L}(V)$,$\lambda_1, \ldots, \lambda_m$ 是 $T$ 的全部不同特征值。则 $$ V \;=\; G(\lambda_1, T) \;\oplus\; G(\lambda_2, T) \;\oplus\; \cdots \;\oplus\; G(\lambda_m, T). $$ 并且每个 $G(\lambda_j, T)$ 是 $T$-不变的,$T|_{G(\lambda_j, T)} - \lambda_j I$ 是幂零算子。

对比 5.55 (3):"可对角化 $\iff V = E(\lambda_1) \oplus \cdots \oplus E(\lambda_m)$"。8.21 是把 $E$ 替换成 $G$,结论无条件成立(在 $\mathbf{C}$ 上)。

每块的内部结构:在 $G(\lambda_j, T)$ 里,$T$ 的作用可以写成 $\lambda_j I + N_j$,其中 $N_j = T|_{G_j} - \lambda_j I$ 是幂零算子。每一块就是"常数 $\lambda_j$ 倍恒等 + 一个幂零扰动"。幂零部分的标准形(见 Q4, Q6)就给出 Jordan 块。

证明梗概(Axler 的路线):

几何直觉:每个 $G(\lambda_j)$ 是 $T$ 围绕特征值 $\lambda_j$ 的"吸引盆地"——在这个子空间里 $T - \lambda_j I$ 最终会把所有向量零化(幂零部分),而与 $\lambda_j$ 对应的行为完全隔离于其他 $\lambda_i$ 的盆地。


幂零算子 nilpotent:$N^k = 0$ 的结构

8.16 定义. $N \in \mathcal{L}(V)$ 称为幂零(nilpotent),如果存在正整数 $k$ 使 $N^k = 0$。最小的这样的 $k$ 称为 $N$ 的幂零指数(index of nilpotence)。

幂零是"一路推下去终会归零"的算子。典型例子:

8.18 命题. 若 $N \in \mathcal{L}(V)$ 是幂零的且 $\dim V = n$,则 $N^n = 0$。(幂零指数 $\leq n$;因此"$\dim V$ 次"已足够验证幂零。)

幂零算子的唯一特征值是 $0$:若 $Nv = \lambda v$($v \neq 0$),则 $0 = N^k v = \lambda^k v$,必 $\lambda = 0$。所以幂零算子的所有特征值都是 $0$——几何上看它的作用"最终把所有向量推到零"。

Jordan 形的根本引擎:8.21 告诉我们 $V = \bigoplus G(\lambda_j, T)$;在每个 $G(\lambda_j, T)$ 上 $T - \lambda_j I$ 是幂零算子。所以"给 $T$ 找 Jordan 形"= "给每个幂零算子 $T|_{G_j} - \lambda_j I$ 找标准形"。下面的 Q6 说明幂零算子的标准形就是若干个"$0$ 对角 Jordan 块"$J_k(0)$ 直和。把对角上的 $0$ 替换回 $\lambda_j$,就得到 $T$ 在 $G_j$ 上的 Jordan 块 $J_k(\lambda_j)$。


亲眼看剪切:$G(\lambda, T)$ 如何补齐 $E(\lambda, T)$(2D 交互)

把任意 $2 \times 2$ 矩阵 $T$ 输入下方滑杆,画布显示:

尝试预设"剪切":可见一条黄线($x$ 轴)+ 一条紫线(任意非 $x$ 轴方向的向量都是 $G(1, T) \setminus E(1, T)$ 元素,因 $G(1, T) = \mathbf{R}^2$)。这正是 $J_2(1)$。

$Tv$ 位移 $E(\lambda, T)$ 特征方向 $G \setminus E$(Jordan 方向)

矩阵 $T = \begin{pmatrix}a & b\\c & d\end{pmatrix}$

1.00
1.00
0.00
1.00

Jordan 结构


Jordan 块 $J_n(\lambda)$ 的精确结构

Jordan 块 $J_n(\lambda)$. $n \times n$ 矩阵,对角线全为 $\lambda$,正上邻线(super-diagonal)全为 $1$,其余为 $0$: $$ J_n(\lambda) \;=\; \begin{pmatrix} \lambda & 1 & & & \\ & \lambda & 1 & & \\ & & \ddots & \ddots & \\ & & & \lambda & 1 \\ & & & & \lambda \end{pmatrix} \;=\; \lambda I + N_n,\quad N_n = \begin{pmatrix} 0 & 1 & & \\ & 0 & 1 & \\ & & \ddots & 1 \\ & & & 0 \end{pmatrix}. $$

$N_n$ 是 $n$ 阶幂零算子(标准型):$N_n e_i = e_{i-1}$($i \geq 2$)、$N_n e_1 = 0$。它把基"右移一位" —— $e_n \to e_{n-1} \to \cdots \to e_1 \to 0$。所以 $N_n^n = 0$ 但 $N_n^{n-1} \neq 0$,幂零指数正好是 $n$。

$J_n(\lambda)$ 的关键性质

Jordan 链(Jordan chain):选 $v_1 = e_1, v_2 = e_2, \ldots, v_n = e_n$,则满足

$(T - \lambda I) v_k = v_{k-1}\ (k \geq 2),\qquad (T - \lambda I) v_1 = 0.$

$v_1$ 是真正的特征向量(一次零化);$v_2$ 需两次才零化;…… $v_n$ 需 $n$ 次。整串 $\{v_1, \ldots, v_n\}$ 就是长度 $n$ 的 Jordan 链。$T$ 在这组基下的矩阵正是 $J_n(\lambda)$。


Jordan 定理:每个复算子相似于 Jordan 块直和

8.60 Jordan 形定理. 设 $V$ 是有限维复向量空间,$T \in \mathcal{L}(V)$。则存在 $V$ 的一组基 $\beta$,使 $T$ 在 $\beta$ 下的矩阵为 Jordan 形: $$ M(T, \beta) \;=\; \begin{pmatrix} J_{n_1}(\lambda_1) & & & \\ & J_{n_2}(\lambda_2) & & \\ & & \ddots & \\ & & & J_{n_r}(\lambda_r) \end{pmatrix} $$ 其中 $\lambda_j$ 是 $T$ 的特征值(可以重复出现于不同块),$n_1 + \cdots + n_r = \dim V$。块的大小与个数在同构意义下唯一(不计块的排列次序)。

怎么读 Jordan 形:每个块 $J_{n_i}(\lambda_i)$ 对应一条长度为 $n_i$ 的 Jordan 链。同一个 $\lambda$ 可以出现在多条链里——它们的长度组合完全刻画了 $G(\lambda, T)$ 的内部结构:

对于每个 $\lambda$:
$\dim E(\lambda, T) \;=\;$ 与 $\lambda$ 对应的 Jordan 块个数(几何重数 = 链数)
$\dim G(\lambda, T) \;=\;$ 块大小之和(代数重数 = 链长和)

从算子角度看 Jordan 形的"唯一性":块的大小完全由不变量 $\dim \operatorname{null}(T - \lambda I)^k$($k = 1, 2, \ldots$)决定。具体地,$\lambda$ 对应"大小 $\geq k$ 的块个数" $= \dim \operatorname{null}(T - \lambda I)^k - \dim \operatorname{null}(T - \lambda I)^{k-1}$。

注意:Jordan 形在 $\mathbf{R}$ 上不总存在——需要特征多项式在 $\mathbf{R}$ 上完全分裂(所有特征值都是实数)。在 $\mathbf{C}$ 上由代数基本定理自动满足,故 Jordan 形总存在。实数域上的替代品是"实 Jordan 形"(含 $2 \times 2$ 旋转块),本章不展开。


3×3 矩阵的 Jordan 结构(3D 交互)

3×3 情形的 Jordan 形可能是:

下面场景里:黄色箭头 = $T$ 的实特征方向(每个 Jordan 块贡献一条,因几何重数 = 链数);灰色线框 = 单位立方体;彩色立体 = $T$ 变形后的结果。Space 暂停,R 复位相机。

右侧读数显示:每个实特征值、它的几何重数(Jordan 块个数)、代数重数(广义特征空间维数)、整体是否可对角化。

实特征方向(每个 Jordan 块 1 条) 单位立方体被 $T$ 变形

矩阵 $T \in \mathbf{R}^{3 \times 3}$

Jordan 分析


代数重数 vs 几何重数:Jordan 视角下的精确关系

Jordan 形让这两个重数得到最干净的诠释。设 $\lambda$ 是 $T$ 的一个特征值。

8.26 定理(代数重数 = $\dim G$). 在复空间上,$\lambda$ 作为 $T$ 特征多项式 $p_T$ 的根的重数 $\;=\; \dim G(\lambda, T)$。

Jordan 视角下的重数速查

例子速查

这三个都有特征多项式 $(z - 5)^3$,代数重数都是 $3$——但 Jordan 形把它们区分开。仅凭特征多项式无法区分 $J_3(5)$ 和 $5I_3$,但它们代表截然不同的几何。

精细结构:若 $\lambda$ 对应的 Jordan 块大小为 $n_1 \geq n_2 \geq \cdots \geq n_r$(几何重数 $= r$、代数重数 $= \sum n_i$),则

$\dim \operatorname{null}(T - \lambda I)^k \;=\; \sum_i \min(n_i, k).$

这条公式反过来可以从 $\operatorname{null}(T - \lambda I)^k$ 的维数增量恢复所有块大小——即 Jordan 形的"反向工程"。


Cayley-Hamilton 定理:$p_T(T) = 0$

8.37 Cayley-Hamilton 定理. 设 $V$ 是有限维复空间,$T \in \mathcal{L}(V)$,$p_T$ 是 $T$ 的特征多项式。则 $$ p_T(T) \;=\; 0. $$ (即每个算子被自己的特征多项式"零化"。)

用 Jordan 形秒证:设 $p_T(z) = \prod_j (z - \lambda_j)^{d_j}$,其中 $d_j = \dim G(\lambda_j, T)$ 是代数重数。由 8.21 分解 $V = \bigoplus G(\lambda_j, T)$,要证 $p_T(T) v = 0$ 对每个 $v \in V$——只需对每个 $v \in G(\lambda_j, T)$ 证明。

在 $G(\lambda_j, T)$ 上 $T - \lambda_j I$ 是幂零的,幂零指数 $\leq \dim G(\lambda_j, T) = d_j$(8.18)。所以 $(T - \lambda_j I)^{d_j} v = 0$,一个因子就能把 $v$ 打掉。而 $p_T(T) = \prod_j (T - \lambda_j I)^{d_j}$ 含有这个因子,故 $p_T(T) v = 0$。∎

警惕:$\deg p_T = n$,不要"推不出来"。常见错误:"$p_T(T) = \det(T I - T) = \det 0 = 0$"——这是无效的:$p_T$ 是一个多项式(取 $T$ 的系数组合),不是一个"代入"。正确的 C-H 证明依赖 8.21(或更古典的 adjugate 展开)。

重要推论:Cayley-Hamilton 意味着 $T^n$($n = \dim V$)可以写成 $I, T, T^2, \ldots, T^{n-1}$ 的线性组合。于是 $T^{-1}$(如果存在)也在这个子代数里——可通过 $p_T$ 反解 $T^{-1}$:

若 $p_T(z) = z^n + c_{n-1} z^{n-1} + \cdots + c_1 z + c_0$,$c_0 \neq 0$(等价于 $T$ 可逆),则
$T^{-1} \;=\; -\frac{1}{c_0}(T^{n-1} + c_{n-1} T^{n-2} + \cdots + c_1 I)$

这是"算 $T^{-1}$ 不用 Gauss 消元"的代数法——数值稳定性差、但结构上清晰。


最小多项式 $m_T$:$m_T | p_T$,根集相同

除特征多项式外,每个算子还有一个"更精简"的多项式:

5.27 最小多项式. $T \in \mathcal{L}(V)$ 的最小多项式 $m_T$ 是次数最低的首一(leading coefficient $= 1$)多项式,满足 $m_T(T) = 0$。它唯一存在。
$m_T$ 与 $p_T$ 的关系.
  • (a) $m_T$ 整除 $p_T$ (即 $p_T = q \cdot m_T$ 对某个多项式 $q$)
  • (b) $m_T$ 与 $p_T$ 根集相同:两者的根集都等于 $T$ 的特征值集合
  • (c) 重数不一定相同:$m_T$ 中 $\lambda$ 的重数 = 最大 Jordan 块大小(对应 $\lambda$);$p_T$ 中 $\lambda$ 的重数 = 所有对应块大小之和

Jordan 形直读:对每个特征值 $\lambda$

$m_T$ 中 $\lambda$ 的重数 $= \max\{n_i : n_i $ 是与 $\lambda$ 对应的 Jordan 块大小$\}$
$p_T$ 中 $\lambda$ 的重数 $= \sum_i n_i$(所有相关块大小之和)

例子(所有特征值仅 $\lambda = 5$,代数重数 $4$):

$m_T$ 精准告诉你"最大 Jordan 块多大"——这是 $p_T$ 看不到的结构。由 (a) 和 Cayley-Hamilton,$p_T(T) = 0$,所以 $m_T | p_T$ 马上可得(次数最低性)。


可对角化的最终判据:$m_T$ 无重根

把 Ch 5D 的五等价条件 (5.55) 重新挂出来——最优美的是第 (5) 条:

判据. $T$ 可对角化 $\iff m_T$ 可写成互不相同一次因子之积: $$ m_T(z) \;=\; (z - \lambda_1)(z - \lambda_2) \cdots (z - \lambda_m). $$

为什么(Jordan 视角):由 Q11,$m_T$ 中 $\lambda$ 的重数 = 与 $\lambda$ 对应的最大 Jordan 块大小。所以

$m_T$ 无重根 $\iff$ 每个 $\lambda$ 的最大 Jordan 块大小 = 1 $\iff$ 所有 Jordan 块都是 $1 \times 1$ $\iff$ Jordan 形即对角形 $\iff T$ 可对角化

例子对比

实战诀窍:"证 $T$ 可对角化"的最轻量路径:找任何一个没有重根且 $T$ 满足的多项式 $p$,则 $m_T | p$,故 $m_T$ 也没重根,结束。这个套路避开了显式计算特征向量。


Ch 8 要记住的"底子定理"

8.10 定义. $G(\lambda, T) = \operatorname{null}(T - \lambda I)^{\dim V}$:广义特征空间,包含 $E(\lambda, T)$
8.13 / 8.21 分解. 复向量空间 $V = G(\lambda_1, T) \oplus \cdots \oplus G(\lambda_m, T)$;$T|_{G_j} - \lambda_j I$ 是幂零算子
8.18 幂零. 若 $N$ 幂零、$\dim V = n$,则 $N^n = 0$。唯一特征值 $0$
8.26 重数. 代数重数 $=\dim G(\lambda, T)$;几何重数 $=\dim E(\lambda, T)$;$1 \leq$ 几何 $\leq$ 代数
8.37 Cayley-Hamilton. $p_T(T) = 0$:每个算子被自己的特征多项式零化
8.60 Jordan 形. 每个复算子相似于 $\bigoplus_i J_{n_i}(\lambda_i)$,块的多重集唯一
可对角化判据. $T$ 可对角化 $\iff m_T$ 无重根 $\iff$ Jordan 形全是 $1\times 1$ 块

Axler Ch 8 习题(pp.260-294)


Ch 8 在工程里干嘛用?(ODE + 矩阵指数)

Jordan 形最重要的应用:线性常微分方程组

线性 ODE $\dot x = Ax$ 的通解

考虑 $n$ 维线性 ODE $\dot x = Ax$,$A \in \mathbf{R}^{n \times n}$。形式解 $x(t) = e^{tA} x(0)$,其中矩阵指数

$\displaystyle e^{tA} \;=\; \sum_{k=0}^{\infty} \frac{t^k A^k}{k!} \;=\; I + tA + \tfrac{t^2}{2} A^2 + \tfrac{t^3}{6} A^3 + \cdots$

若 $A$ 可对角化(Ch 5D):$A = P D P^{-1}$,$e^{tA} = P e^{tD} P^{-1}$,$e^{tD}$ 对角,每个对角元是 $e^{\lambda_i t}$。通解 $x(t) = \sum_i c_i e^{\lambda_i t} v_i$——纯指数模式。

若 $A$ 不可对角化(本章主角):把 $A$ 放到 Jordan 形 $A = P J P^{-1}$。对单块 $J_n(\lambda) = \lambda I + N_n$,由 $\lambda I$ 与 $N_n$ 可交换:

$e^{t J_n(\lambda)} \;=\; e^{\lambda t} \cdot e^{t N_n} \;=\; e^{\lambda t} \bigl(I + t N_n + \tfrac{t^2}{2} N_n^2 + \cdots + \tfrac{t^{n-1}}{(n-1)!} N_n^{n-1}\bigr)$

(因 $N_n^n = 0$ 级数终止在第 $n-1$ 项。)展开成矩阵:

$e^{t J_n(\lambda)} \;=\; e^{\lambda t}\begin{pmatrix} 1 & t & \tfrac{t^2}{2} & \cdots & \tfrac{t^{n-1}}{(n-1)!} \\ 0 & 1 & t & \cdots & \tfrac{t^{n-2}}{(n-2)!} \\ \vdots & & \ddots & & \vdots \\ 0 & 0 & 0 & \cdots & 1 \end{pmatrix}$

通解形式是 $t^k e^{\lambda t}$ 的组合,其中 $k = 0, 1, \ldots, n-1$(Jordan 块大小 $-1$)。这就是 ODE 教材说的"重根对应 $t e^{\lambda t}, t^2 e^{\lambda t}, \ldots$"的代数根据——$t^k$ 因子恰好对应 Jordan 块的大小

稳定性分析

$\dot x = Ax$ 的零解 $x \equiv 0$ 的渐近稳定性由 $A$ 的特征值决定:

最后一条是 Jordan 结构的真·相关——仅凭特征值看不到,必须知道块的大小。控制理论、结构振动、电路分析全都用这个判据。

快速数值算 $e^{tA}$ 的套路

直接级数展开要无穷项;用 Jordan 形或等价的 Schur 分解(数值上更稳定)把 $e^{tA}$ 归约到算 $e^{\lambda t}(1 + t + \cdots)$ 的块对角问题,然后合回去。MATLAB 的 expm、SciPy 的 scipy.linalg.expm 本质上都在算这个。


Ch 8 搞懂后,下一步?

两条路,都很重要:

做完 Ch 9 后你会看到 Axler 整本书的结构美学:"算子 → 特征值 → 广义特征空间 → Jordan → 行列式(作为 $\prod \lambda_i$)"。线性代数的每个概念自然出现,无任何 ad hoc 公式——这也是这本书区别于传统教材的根本。

面向应用:Jordan 形本身很少在数值计算里直接用(数值不稳定,微小扰动就破坏块结构),但它是理论工具——证明控制理论、线性系统、PDE 正则性、矩阵方程的底子。实务中常用Schur 分解($A = Q T Q^*$,$T$ 上三角)作为数值稳定替代品,Schur 的对角元仍然是特征值,部分保留了 Jordan 的层级信息。


★ 轮到你了——自测 8 题

每题先独立想 3 分钟再看答案。难度:★ 概念/简单计算 · ★★ 证明 · ★★★ 综合/开放。

E1 ★算 Jordan 形:下列矩阵的 Jordan 形是什么?

(a) $\bigl(\begin{smallmatrix}3&1\\0&3\end{smallmatrix}\bigr)$   (b) $\bigl(\begin{smallmatrix}2&0\\0&2\end{smallmatrix}\bigr)$   (c) $\bigl(\begin{smallmatrix}5&0\\0&7\end{smallmatrix}\bigr)$   (d) $\bigl(\begin{smallmatrix}0&1&0\\0&0&1\\0&0&0\end{smallmatrix}\bigr)$

提示

对每个矩阵先算特征多项式 → 特征值 → 每个 $\lambda$ 的几何重数 → 组合成 Jordan 块。记住:几何重数 = 块个数,代数重数 = 块大小和。

答案

(a) $J_2(3)$。$p = (z-3)^2$,$E(3)$ 维数 $1$,故 $1$ 个大小 $2$ 的块。

(b) $[2] \oplus [2] = 2I_2$。$p = (z-2)^2$,$E(2) = \mathbf{R}^2$ 维数 $2$,故 $2$ 个大小 $1$ 的块。(b) 与 (a) 特征多项式相同但 Jordan 形不同——这就是 $p_T$ 无法区分的精细结构。

(c) $[5] \oplus [7]$。已经对角。

(d) $J_3(0)$。$p = z^3$,$\operatorname{null}(T) = \operatorname{span}\{e_1\}$ 维数 $1$,故 $1$ 个大小 $3$ 的 $0$-块——这正是标准 $3$ 阶幂零。

E2 ★证:幂零算子的唯一特征值是 $0$

设 $N \in \mathcal{L}(V)$ 幂零,幂零指数 $k$。证 $N$ 的所有特征值都是 $0$。

提示

若 $Nv = \lambda v$,$v \neq 0$,对 $N^k v$ 双边计算。

答案

设 $Nv = \lambda v$,$v \neq 0$。则 $N^k v = \lambda^k v$(归纳:$N^j v = \lambda^j v$)。

另一方面 $N^k = 0$,所以 $N^k v = 0$。

故 $\lambda^k v = 0$。因 $v \neq 0$,得 $\lambda^k = 0 \Rightarrow \lambda = 0$。∎

反向:若 $N$ 的唯一特征值是 $0$(且在 $\mathbf{C}$ 上),则由 8.21 $V = G(0, N)$ 整个是 $0$ 的广义特征空间,所以 $N^{\dim V} = 0$,即 $N$ 幂零。两者等价。

E3 ★★证:$J_n(\lambda)$ 的最小多项式是 $(z - \lambda)^n$

设 $J = J_n(\lambda)$ 是 $n$ 阶 Jordan 块。证 $m_J(z) = (z - \lambda)^n$。

提示

算 $(J - \lambda I)^k = N_n^k$,看哪个 $k$ 开始为 $0$。$N_n$ 的作用是"把基右移一位"。

答案

令 $N = J - \lambda I$。在标准基 $e_1, \ldots, e_n$ 下 $N e_i = e_{i-1}$($i \geq 2$)、$N e_1 = 0$。

$N^k e_i = e_{i - k}$(当 $i > k$,否则为 $0$)。特别 $N^{n-1} e_n = e_1 \neq 0$,所以 $N^{n-1} \neq 0$。

$N^n e_i = 0$ 对所有 $i$($e_i$ 被右移 $n$ 步出界),所以 $N^n = 0$。

故 $(z - \lambda)^n$ 是零化多项式,$(z - \lambda)^{n-1}$ 不是——$(z - \lambda)^n$ 是最小的(因为任何低次零化多项式必须是 $(z - \lambda)^k$ 形式——$J$ 唯一特征值 $\lambda$,$m_J$ 的根集 = 特征值集)。

结论 $m_J(z) = (z - \lambda)^n$。同时 $p_J(z) = (z - \lambda)^n$,两者一致——这是 $J_n(\lambda)$ 单块的特征。∎

E4 ★★用 Cayley-Hamilton 算 $A^{-1}$

设 $A = \bigl(\begin{smallmatrix}2&1\\0&3\end{smallmatrix}\bigr)$。用 $p_A(A) = 0$ 推出 $A^{-1}$。

提示

$p_A(z) = (z - 2)(z - 3) = z^2 - 5z + 6$。由 C-H,$A^2 - 5A + 6I = 0$。整理出 $A \cdot (?) = I$。

答案

$p_A(z) = z^2 - 5z + 6$。Cayley-Hamilton:$A^2 - 5A + 6I = 0 \Rightarrow 6I = 5A - A^2 = A(5I - A)$。

所以 $A^{-1} = \frac{1}{6}(5I - A) = \frac{1}{6}\begin{pmatrix}5 - 2 & -1 \\ 0 & 5 - 3\end{pmatrix} = \frac{1}{6}\begin{pmatrix}3 & -1 \\ 0 & 2\end{pmatrix} = \begin{pmatrix}1/2 & -1/6 \\ 0 & 1/3\end{pmatrix}$.

验:$A A^{-1} = \bigl(\begin{smallmatrix}2&1\\0&3\end{smallmatrix}\bigr)\bigl(\begin{smallmatrix}1/2&-1/6\\0&1/3\end{smallmatrix}\bigr) = \bigl(\begin{smallmatrix}1&-1/3+1/3\\0&1\end{smallmatrix}\bigr) = I$ ✓

E5 ★★区分两个代数重数相同但 Jordan 形不同的矩阵

设 $A = \bigl(\begin{smallmatrix}5&0\\0&5\end{smallmatrix}\bigr)$、$B = \bigl(\begin{smallmatrix}5&1\\0&5\end{smallmatrix}\bigr)$。两者特征多项式都是 $(z-5)^2$。证 $A, B$ 不相似(即 $\nexists$ 可逆 $P$ 使 $P^{-1}AP = B$)。

提示

找一个相似不变量能区分它们——例如 $\operatorname{rank}(A - 5I)$ vs $\operatorname{rank}(B - 5I)$,或 $\dim E(5, \cdot)$。

答案

若 $P^{-1} A P = B$,则 $P^{-1}(A - 5I)P = B - 5I$(同时减 $5I$)。相似变换保秩,所以 $\operatorname{rank}(A - 5I) = \operatorname{rank}(B - 5I)$。

算:$A - 5I = 0_{2\times 2}$,秩 $0$;$B - 5I = \bigl(\begin{smallmatrix}0&1\\0&0\end{smallmatrix}\bigr)$,秩 $1$。

$0 \neq 1$,矛盾。故 $A \not\sim B$。∎

Jordan 形语言:$A$ 的 Jordan 形是 $[5] \oplus [5]$(两个 $1 \times 1$ 块),$B$ 的是 $J_2(5)$(一个 $2 \times 2$ 块)。Jordan 形的唯一性(8.60)直接给出它们不相似。

E6 ★★证:若 $T^3 = T$,则 $T$ 可对角化

设 $T \in \mathcal{L}(V)$ 满足 $T^3 = T$(特征值 $\in \{0, 1, -1\}$)。证 $T$ 可对角化。

提示

找一个没有重根的零化多项式。最小多项式必须整除它。

答案

$T^3 - T = T(T - I)(T + I) = 0$,即 $p(z) = z(z-1)(z+1)$ 是 $T$ 的零化多项式。

$p$ 有三个不同的根 $0, 1, -1$——无重根。

最小多项式 $m_T | p$(最小多项式整除任何零化多项式)。所以 $m_T$ 也没有重根(是 $p$ 的一次因子的子积)。

由 Q12 判据,$T$ 可对角化。∎

进一步:$V = E(0, T) \oplus E(1, T) \oplus E(-1, T)$(对应 $m_T$ 的根),分别是 $\operatorname{null} T$、$\operatorname{null}(T-I)$、$\operatorname{null}(T+I)$。

E7 ★★ODE 里 $t e^{\lambda t}$ 的来源:解 $\dot x = J_2(1) x$

解 $\dot x = Jx$,其中 $J = J_2(1) = \bigl(\begin{smallmatrix}1&1\\0&1\end{smallmatrix}\bigr)$,初值 $x(0) = (x_0, y_0)^\top$。

提示

用 $e^{tJ} = e^{t(I + N)} = e^t \cdot e^{tN}$,$N = \bigl(\begin{smallmatrix}0&1\\0&0\end{smallmatrix}\bigr)$,$N^2 = 0$ 所以 $e^{tN} = I + tN$。

答案

$J = I + N$,$N = \bigl(\begin{smallmatrix}0&1\\0&0\end{smallmatrix}\bigr)$,$N^2 = 0$。因 $I$ 与 $N$ 可交换:

$e^{tJ} = e^{tI} e^{tN} = e^t \cdot (I + tN) = \bigl(\begin{smallmatrix}e^t & t e^t \\ 0 & e^t\end{smallmatrix}\bigr)$。

故 $x(t) = e^{tJ} x(0) = \bigl(\begin{smallmatrix}e^t x_0 + t e^t y_0 \\ e^t y_0\end{smallmatrix}\bigr) = e^t \bigl(\begin{smallmatrix}x_0 + t y_0 \\ y_0\end{smallmatrix}\bigr)$.

观察:第一分量出现 $t e^t$——指数 $\times$ 线性因子。这就是 ODE 课里"重根导致 $te^{\lambda t}$ 项"的完整代数解释,$t$ 的幂 = Jordan 块大小 $- 1$。

E8 ★★★Jordan 反工程:从 $\operatorname{null}(T - \lambda I)^k$ 的维数恢复块大小

设 $T$ 作用于 $\mathbf{C}^6$ 上,唯一特征值是 $\lambda = 2$,且 $\dim \operatorname{null}(T - 2I) = 3$、$\dim \operatorname{null}(T - 2I)^2 = 5$、$\dim \operatorname{null}(T - 2I)^3 = 6$(稳定)。问 $T$ 的 Jordan 形是什么?

提示

大小 $\geq k$ 的块个数 $= \dim \operatorname{null}(T - \lambda I)^k - \dim \operatorname{null}(T - \lambda I)^{k-1}$。逐个算出"大小 $\geq 1, 2, 3, \ldots$"的块个数。

答案

设 $d_k = \dim \operatorname{null}(T - 2I)^k$,则 $d_0 = 0, d_1 = 3, d_2 = 5, d_3 = 6, d_k = 6$($k \geq 3$)。

大小 $\geq k$ 的块个数 $= d_k - d_{k-1}$:

  • 大小 $\geq 1$:$d_1 - d_0 = 3$(共 $3$ 个块)
  • 大小 $\geq 2$:$d_2 - d_1 = 2$(其中 $2$ 个块大小 $\geq 2$)
  • 大小 $\geq 3$:$d_3 - d_2 = 1$($1$ 个块大小 $\geq 3$)
  • 大小 $\geq 4$:$d_4 - d_3 = 0$(无)

故块大小分布(用差分):

  • 大小恰为 $3$:$1 - 0 = 1$ 个
  • 大小恰为 $2$:$2 - 1 = 1$ 个
  • 大小恰为 $1$:$3 - 2 = 1$ 个

Jordan 形 $= J_3(2) \oplus J_2(2) \oplus J_1(2)$,总维 $= 3 + 2 + 1 = 6$ ✓

验:几何重数 $= $ 块个数 $= 3 = d_1$ ✓;代数重数 $= $ 总维 $= 6$ ✓;$m_T(z) = (z - 2)^3$(最大块大小)。

完成度自检:E1-E2 通 = 会识别 Jordan 形;E3-E5 证明 = 理解唯一性;E6-E8 搞定 = 能操作最小多项式、ODE 应用、反工程——准备好读 Ch 9。E8 的"从 null 空间维数恢复 Jordan"是所有 Jordan 判据背后的机械过程,值得刻在肌肉记忆里。