Axler 8 · Generalized Eigenvectors & Jordan Form

符号	念作	含义	类型
$V$, $T$	V, T	有限维复向量空间（本章主要在 $\mathbf{C}$ 上）；$T \in \mathcal{L}(V)$	空间 + 算子
$\lambda$	lambda	$T$ 的特征值：$\exists v \neq 0, Tv = \lambda v$	$\mathbf{F}$ 中的数
$E(\lambda, T)$	$\lambda$ 的特征空间	$\operatorname{null}(T - \lambda I)$（Ch 5 的主角）	$V$ 的子空间
$G(\lambda, T)$	$\lambda$ 的广义特征空间	$\operatorname{null}(T - \lambda I)^{\dim V}$（8.10 定义）	$V$ 的子空间
广义特征向量	generalized eigenvector	$G(\lambda, T)$ 中的非零向量——存在 $k$ 使 $(T-\lambda I)^k v = 0$	向量
幂零算子	nilpotent	$N \in \mathcal{L}(V)$，$\exists k \geq 1$ 使 $N^k = 0$（8.16）	特殊算子
$J_n(\lambda)$	$n$ 阶 Jordan 块	$\lambda$ 在对角，上对角线全 1，其他 0：$\lambda I + $ 幂零	$n \times n$ 矩阵
Jordan 标准形	Jordan canonical form	Jordan 块沿对角线直和：$\bigoplus J_{n_i}(\lambda_i)$（8.60）	矩阵标准形
代数重数	algebraic multiplicity	$\dim G(\lambda, T)$ $=$ $\lambda$ 在特征多项式中的重数（8.26）	整数 $\geq 1$
几何重数	geometric multiplicity	$\dim E(\lambda, T)$ $=$ Jordan 块个数（对应 $\lambda$）	整数 $\geq 1$
$p_T(z)$	特征多项式	$p_T(z) = \prod_i (z - \lambda_i)^{d_i}$，$d_i = \dim G(\lambda_i, T)$（8.27）	$z$ 的多项式
$m_T(z)$	最小多项式	唯一首一多项式使 $m_T(T) = 0$ 且次数最低（5.27）	$z$ 的多项式
$\bigoplus$	直和	$V = G_1 \oplus \cdots \oplus G_m$：每个 $v$ 唯一分解	子空间关系
Cayley-Hamilton	C-H 定理	$p_T(T) = 0$：每个算子被自己的特征多项式零化（8.37）	定理

为什么需要 Jordan 形？5D 的可对角化不是够了吗？

不够。Ch 5D 给出了可对角化的五等价判据（5.55），但不是每个算子都满足。经典反例：剪切

$T = \begin{pmatrix}1 & 1 \\ 0 & 1\end{pmatrix}$

它的特征多项式 $p(\lambda) = (\lambda - 1)^2$ 把 $\lambda = 1$ 算作重数 $2$，但特征空间 $E(1, T) = \operatorname{span}\{(1, 0)\}$ 只有 1 维——"缺一个特征向量"。在实数或复数域上都无法找到第二个线性无关的特征向量，所以 $T$ 不可对角化。

然而 $T$ 并非"无结构可谈"——它确实有一个标准形：它自己就是一个 Jordan 块 $J_2(1)$。Jordan 定理断言：

Jordan 定理（8.60，口语化）. 对任何复向量空间上的算子 $T$，总能找到一组基，使 $T$ 在这组基下的矩阵是若干 Jordan 块 沿对角线堆叠的形状 $\operatorname{diag}(J_{n_1}(\lambda_1), J_{n_2}(\lambda_2), \ldots)$。

几何上：当特征向量"不够用"时，我们放宽——只要求 $(T - \lambda I)^k v = 0$ 对某个 $k$ 成立（而不必 $k = 1$），就叫广义特征向量。这样每个 $\lambda$ 都能凑齐它的"代数重数维"那么多的广义特征向量，拼起来必然够用。

一句话总结：Ch 5D 把"有特征基"叫可对角化；Ch 8 证明"总有广义特征基"，代价是矩阵不再纯对角，而是"对角 + 上邻 1"的 Jordan 块。

广义特征空间 $G(\lambda, T)$ 到底是什么？

8.10 定义（广义特征空间）. 设 $T \in \mathcal{L}(V)$，$\lambda \in \mathbf{F}$。$\lambda$ 对应的广义特征空间为 $$ G(\lambda, T) \;=\; \operatorname{null}(T - \lambda I)^{\dim V}. $$ $G(\lambda, T)$ 中的非零向量称为 $\lambda$ 的广义特征向量。

对比常规特征空间 $E(\lambda, T) = \operatorname{null}(T - \lambda I)$：特征向量要求 $Tv = \lambda v$ 一步到位；广义特征向量则允许多步——存在 $k$ 使 $(T - \lambda I)^k v = 0$。所以 $E(\lambda, T) \subseteq G(\lambda, T)$，严格包含当且仅当 Jordan 块存在。

为什么指数取 $\dim V$？ 因为零空间链稳定下来：

$\{0\} = \operatorname{null}(T - \lambda I)^0 \subseteq \operatorname{null}(T - \lambda I)^1 \subseteq \operatorname{null}(T - \lambda I)^2 \subseteq \cdots$

Axler 8.4 证明这条链最多在第 $\dim V$ 步就稳定（之后不再增大）。所以"到 $\dim V$ 次"足够，取更大的次数结果相同。

剪切例子：$T = \bigl(\begin{smallmatrix}1&1\\0&1\end{smallmatrix}\bigr)$，$\lambda = 1$。

$T - I = \bigl(\begin{smallmatrix}0&1\\0&0\end{smallmatrix}\bigr)$，$\operatorname{null}(T - I) = \operatorname{span}\{(1, 0)\}$——特征空间 1 维
$(T - I)^2 = 0$，$\operatorname{null}(T - I)^2 = \mathbf{R}^2$ 整个空间——广义特征空间 2 维 ✅

广义特征空间把"不够用的 $E$"补齐到代数重数那么大，这就是 Jordan 能绕过剪切的根本。

8.13 命题. 对每个 $\lambda$：$E(\lambda, T) \subseteq G(\lambda, T)$，且 $G(\lambda, T)$ 是 $T$-不变子空间（$T$ 作用后仍在里面）。

关键分解：$V = G(\lambda_1, T) \oplus \cdots \oplus G(\lambda_m, T)$

Ch 8 的主命题，等价于 Jordan 定理的"空间版本"：

8.21 广义特征空间分解定理. 设 $V$ 是有限维复向量空间，$T \in \mathcal{L}(V)$，$\lambda_1, \ldots, \lambda_m$ 是 $T$ 的全部不同特征值。则 $$ V \;=\; G(\lambda_1, T) \;\oplus\; G(\lambda_2, T) \;\oplus\; \cdots \;\oplus\; G(\lambda_m, T). $$ 并且每个 $G(\lambda_j, T)$ 是 $T$-不变的，$T|_{G(\lambda_j, T)} - \lambda_j I$ 是幂零算子。

对比 5.55 (3)："可对角化 $\iff V = E(\lambda_1) \oplus \cdots \oplus E(\lambda_m)$"。8.21 是把 $E$ 替换成 $G$，结论无条件成立（在 $\mathbf{C}$ 上）。

每块的内部结构：在 $G(\lambda_j, T)$ 里，$T$ 的作用可以写成 $\lambda_j I + N_j$，其中 $N_j = T|_{G_j} - \lambda_j I$ 是幂零算子。每一块就是"常数 $\lambda_j$ 倍恒等 + 一个幂零扰动"。幂零部分的标准形（见 Q4, Q6）就给出 Jordan 块。

证明梗概（Axler 的路线）：

(i) 用 5.27 存在定理：复空间上 $T$ 一定有特征值 $\lambda_1$
(ii) 用 $V = G(\lambda_1) \oplus V'$，$V' = \operatorname{range}(T - \lambda_1 I)^{\dim V}$ 做空间分裂
(iii) $T|_{V'}$ 不再以 $\lambda_1$ 为特征值，对 $V'$ 归纳继续分

几何直觉：每个 $G(\lambda_j)$ 是 $T$ 围绕特征值 $\lambda_j$ 的"吸引盆地"——在这个子空间里 $T - \lambda_j I$ 最终会把所有向量零化（幂零部分），而与 $\lambda_j$ 对应的行为完全隔离于其他 $\lambda_i$ 的盆地。

幂零算子 nilpotent：$N^k = 0$ 的结构

8.16 定义. $N \in \mathcal{L}(V)$ 称为幂零（nilpotent），如果存在正整数 $k$ 使 $N^k = 0$。最小的这样的 $k$ 称为 $N$ 的幂零指数（index of nilpotence）。

幂零是"一路推下去终会归零"的算子。典型例子：

$\bigl(\begin{smallmatrix}0&1\\0&0\end{smallmatrix}\bigr)$：平方为 $0$。幂零指数 $2$
$\bigl(\begin{smallmatrix}0&1&0\\0&0&1\\0&0&0\end{smallmatrix}\bigr)$：$N^2 \neq 0$，$N^3 = 0$。幂零指数 $3$
微分算子 $D$ 作用于 $n$ 次多项式空间：$D^{n+1} p = 0$ 对所有 $\deg p \leq n$。幂零指数 $n + 1$

8.18 命题. 若 $N \in \mathcal{L}(V)$ 是幂零的且 $\dim V = n$，则 $N^n = 0$。（幂零指数 $\leq n$；因此"$\dim V$ 次"已足够验证幂零。）

幂零算子的唯一特征值是 $0$：若 $Nv = \lambda v$（$v \neq 0$），则 $0 = N^k v = \lambda^k v$，必 $\lambda = 0$。所以幂零算子的所有特征值都是 $0$——几何上看它的作用"最终把所有向量推到零"。

Jordan 形的根本引擎：8.21 告诉我们 $V = \bigoplus G(\lambda_j, T)$；在每个 $G(\lambda_j, T)$ 上 $T - \lambda_j I$ 是幂零算子。所以"给 $T$ 找 Jordan 形"= "给每个幂零算子 $T|_{G_j} - \lambda_j I$ 找标准形"。下面的 Q6 说明幂零算子的标准形就是若干个"$0$ 对角 Jordan 块"$J_k(0)$ 直和。把对角上的 $0$ 替换回 $\lambda_j$，就得到 $T$ 在 $G_j$ 上的 Jordan 块 $J_k(\lambda_j)$。

亲眼看剪切：$G(\lambda, T)$ 如何补齐 $E(\lambda, T)$（2D 交互）

把任意 $2 \times 2$ 矩阵 $T$ 输入下方滑杆，画布显示：

黄色虚线 = $E(\lambda_i, T) = \operatorname{null}(T - \lambda_i I)$，真·特征方向
紫色虚线 = $G(\lambda_i, T) \setminus E$ 的额外方向（仅当几何重数 < 代数重数时出现，即有 Jordan 块）
蓝色箭头 = $v \to Tv$ 作用方向
右侧读数 = Jordan 块大小、最小多项式、几何/代数重数

尝试预设"剪切"：可见一条黄线（$x$ 轴）+ 一条紫线（任意非 $x$ 轴方向的向量都是 $G(1, T) \setminus E(1, T)$ 元素，因 $G(1, T) = \mathbf{R}^2$）。这正是 $J_2(1)$。

$Tv$ 位移 $E(\lambda, T)$ 特征方向 $G \setminus E$（Jordan 方向）

矩阵 $T = \begin{pmatrix}a & b\\c & d\end{pmatrix}$

a1.00

b1.00

c0.00

d1.00

Jordan 结构

Jordan 块 $J_n(\lambda)$ 的精确结构

Jordan 块 $J_n(\lambda)$. $n \times n$ 矩阵，对角线全为 $\lambda$，正上邻线（super-diagonal）全为 $1$，其余为 $0$： $$ J_n(\lambda) \;=\; \begin{pmatrix} \lambda & 1 & & & \\ & \lambda & 1 & & \\ & & \ddots & \ddots & \\ & & & \lambda & 1 \\ & & & & \lambda \end{pmatrix} \;=\; \lambda I + N_n,\quad N_n = \begin{pmatrix} 0 & 1 & & \\ & 0 & 1 & \\ & & \ddots & 1 \\ & & & 0 \end{pmatrix}. $$

$N_n$ 是 $n$ 阶幂零算子（标准型）：$N_n e_i = e_{i-1}$（$i \geq 2$）、$N_n e_1 = 0$。它把基"右移一位" —— $e_n \to e_{n-1} \to \cdots \to e_1 \to 0$。所以 $N_n^n = 0$ 但 $N_n^{n-1} \neq 0$，幂零指数正好是 $n$。

$J_n(\lambda)$ 的关键性质：

唯一特征值 $\lambda$（代数重数 $n$）
特征空间 $E(\lambda, J_n(\lambda)) = \operatorname{span}\{e_1\}$，几何重数恒为 $1$（无论 $n$ 多大）
广义特征空间 $G(\lambda, J_n(\lambda)) = \mathbf{C}^n$ 整个空间
最小多项式 $m(z) = (z - \lambda)^n$——与特征多项式完全一致
$n \geq 2$ 时不可对角化

Jordan 链（Jordan chain）：选 $v_1 = e_1, v_2 = e_2, \ldots, v_n = e_n$，则满足

$(T - \lambda I) v_k = v_{k-1}\ (k \geq 2),\qquad (T - \lambda I) v_1 = 0.$

$v_1$ 是真正的特征向量（一次零化）；$v_2$ 需两次才零化；…… $v_n$ 需 $n$ 次。整串 $\{v_1, \ldots, v_n\}$ 就是长度 $n$ 的 Jordan 链。$T$ 在这组基下的矩阵正是 $J_n(\lambda)$。

Jordan 定理：每个复算子相似于 Jordan 块直和

8.60 Jordan 形定理. 设 $V$ 是有限维复向量空间，$T \in \mathcal{L}(V)$。则存在 $V$ 的一组基 $\beta$，使 $T$ 在 $\beta$ 下的矩阵为 Jordan 形： $$ M(T, \beta) \;=\; \begin{pmatrix} J_{n_1}(\lambda_1) & & & \\ & J_{n_2}(\lambda_2) & & \\ & & \ddots & \\ & & & J_{n_r}(\lambda_r) \end{pmatrix} $$ 其中 $\lambda_j$ 是 $T$ 的特征值（可以重复出现于不同块），$n_1 + \cdots + n_r = \dim V$。块的大小与个数在同构意义下唯一（不计块的排列次序）。

怎么读 Jordan 形：每个块 $J_{n_i}(\lambda_i)$ 对应一条长度为 $n_i$ 的 Jordan 链。同一个 $\lambda$ 可以出现在多条链里——它们的长度组合完全刻画了 $G(\lambda, T)$ 的内部结构：

对于每个 $\lambda$：
$\dim E(\lambda, T) \;=\;$ 与 $\lambda$ 对应的 Jordan 块个数（几何重数 = 链数）
$\dim G(\lambda, T) \;=\;$ 块大小之和（代数重数 = 链长和）

从算子角度看 Jordan 形的"唯一性"：块的大小完全由不变量 $\dim \operatorname{null}(T - \lambda I)^k$（$k = 1, 2, \ldots$）决定。具体地，$\lambda$ 对应"大小 $\geq k$ 的块个数" $= \dim \operatorname{null}(T - \lambda I)^k - \dim \operatorname{null}(T - \lambda I)^{k-1}$。

注意：Jordan 形在 $\mathbf{R}$ 上不总存在——需要特征多项式在 $\mathbf{R}$ 上完全分裂（所有特征值都是实数）。在 $\mathbf{C}$ 上由代数基本定理自动满足，故 Jordan 形总存在。实数域上的替代品是"实 Jordan 形"（含 $2 \times 2$ 旋转块），本章不展开。

3×3 矩阵的 Jordan 结构（3D 交互）

3×3 情形的 Jordan 形可能是：

三块 $1 \times 1$：对角矩阵 $\operatorname{diag}(\lambda_1, \lambda_2, \lambda_3)$。可对角化
一块 $2$ + 一块 $1$：$J_2(\mu) \oplus [\lambda]$。不可对角化（至少一个 $\lambda$ 几何重数 < 代数重数）
一块 $3$：$J_3(\lambda)$，唯一特征值，最大病态

下面场景里：黄色箭头 = $T$ 的实特征方向（每个 Jordan 块贡献一条，因几何重数 = 链数）；灰色线框 = 单位立方体；彩色立体 = $T$ 变形后的结果。Space 暂停，R 复位相机。

右侧读数显示：每个实特征值、它的几何重数（Jordan 块个数）、代数重数（广义特征空间维数）、整体是否可对角化。

实特征方向（每个 Jordan 块 1 条）单位立方体被 $T$ 变形

矩阵 $T \in \mathbf{R}^{3 \times 3}$

Jordan 分析

代数重数 vs 几何重数：Jordan 视角下的精确关系

Jordan 形让这两个重数得到最干净的诠释。设 $\lambda$ 是 $T$ 的一个特征值。

8.26 定理（代数重数 = $\dim G$）. 在复空间上，$\lambda$ 作为 $T$ 特征多项式 $p_T$ 的根的重数 $\;=\; \dim G(\lambda, T)$。

Jordan 视角下的重数速查：

几何重数 $= \dim E(\lambda, T) = $ 与 $\lambda$ 对应的 Jordan 块个数（每块贡献一条 Jordan 链，每链只有一个真·特征向量）
代数重数 $= \dim G(\lambda, T) = $ 与 $\lambda$ 对应的块大小之和
不等式 $1 \leq$ 几何 $\leq$ 代数永远成立（每个 $\lambda$ 至少对应 1 个块，每块大小 $\geq 1$）
几何 $=$ 代数 $\iff$ 每个 $\lambda$ 对应的所有块都是 $1 \times 1$ $\iff$ $\lambda$ 在 Jordan 形里全是单对角元

例子速查：

$J_3(5)$：$\lambda = 5$，代数 $= 3$，几何 $= 1$（1 个块，大小 3）
$J_2(5) \oplus [5]$：$\lambda = 5$，代数 $= 3$，几何 $= 2$（2 个块：一个大小 2、一个大小 1）
$[5] \oplus [5] \oplus [5] = 5I_3$：$\lambda = 5$，代数 $= 3$，几何 $= 3$（3 个 $1 \times 1$ 块——对角化了）

这三个都有特征多项式 $(z - 5)^3$，代数重数都是 $3$——但 Jordan 形把它们区分开。仅凭特征多项式无法区分 $J_3(5)$ 和 $5I_3$，但它们代表截然不同的几何。

精细结构：若 $\lambda$ 对应的 Jordan 块大小为 $n_1 \geq n_2 \geq \cdots \geq n_r$（几何重数 $= r$、代数重数 $= \sum n_i$），则

$\dim \operatorname{null}(T - \lambda I)^k \;=\; \sum_i \min(n_i, k).$

这条公式反过来可以从 $\operatorname{null}(T - \lambda I)^k$ 的维数增量恢复所有块大小——即 Jordan 形的"反向工程"。

Cayley-Hamilton 定理：$p_T(T) = 0$

8.37 Cayley-Hamilton 定理. 设 $V$ 是有限维复空间，$T \in \mathcal{L}(V)$，$p_T$ 是 $T$ 的特征多项式。则 $$ p_T(T) \;=\; 0. $$ （即每个算子被自己的特征多项式"零化"。）

用 Jordan 形秒证：设 $p_T(z) = \prod_j (z - \lambda_j)^{d_j}$，其中 $d_j = \dim G(\lambda_j, T)$ 是代数重数。由 8.21 分解 $V = \bigoplus G(\lambda_j, T)$，要证 $p_T(T) v = 0$ 对每个 $v \in V$——只需对每个 $v \in G(\lambda_j, T)$ 证明。

在 $G(\lambda_j, T)$ 上 $T - \lambda_j I$ 是幂零的，幂零指数 $\leq \dim G(\lambda_j, T) = d_j$（8.18）。所以 $(T - \lambda_j I)^{d_j} v = 0$，一个因子就能把 $v$ 打掉。而 $p_T(T) = \prod_j (T - \lambda_j I)^{d_j}$ 含有这个因子，故 $p_T(T) v = 0$。∎

警惕：$\deg p_T = n$，不要"推不出来"。常见错误："$p_T(T) = \det(T I - T) = \det 0 = 0$"——这是无效的：$p_T$ 是一个多项式（取 $T$ 的系数组合），不是一个"代入"。正确的 C-H 证明依赖 8.21（或更古典的 adjugate 展开）。

重要推论：Cayley-Hamilton 意味着 $T^n$（$n = \dim V$）可以写成 $I, T, T^2, \ldots, T^{n-1}$ 的线性组合。于是 $T^{-1}$（如果存在）也在这个子代数里——可通过 $p_T$ 反解 $T^{-1}$：

若 $p_T(z) = z^n + c_{n-1} z^{n-1} + \cdots + c_1 z + c_0$，$c_0 \neq 0$（等价于 $T$ 可逆），则
$T^{-1} \;=\; -\frac{1}{c_0}(T^{n-1} + c_{n-1} T^{n-2} + \cdots + c_1 I)$

这是"算 $T^{-1}$ 不用 Gauss 消元"的代数法——数值稳定性差、但结构上清晰。

最小多项式 $m_T$：$m_T | p_T$，根集相同

除特征多项式外，每个算子还有一个"更精简"的多项式：

5.27 最小多项式. $T \in \mathcal{L}(V)$ 的最小多项式 $m_T$ 是次数最低的首一（leading coefficient $= 1$）多项式，满足 $m_T(T) = 0$。它唯一存在。

$m_T$ 与 $p_T$ 的关系.

(a) $m_T$ 整除 $p_T$ （即 $p_T = q \cdot m_T$ 对某个多项式 $q$）
(b) $m_T$ 与 $p_T$ 根集相同：两者的根集都等于 $T$ 的特征值集合
(c) 重数不一定相同：$m_T$ 中 $\lambda$ 的重数 = 最大 Jordan 块大小（对应 $\lambda$）；$p_T$ 中 $\lambda$ 的重数 = 所有对应块大小之和

Jordan 形直读：对每个特征值 $\lambda$

$m_T$ 中 $\lambda$ 的重数 $= \max\{n_i : n_i $ 是与 $\lambda$ 对应的 Jordan 块大小$\}$
$p_T$ 中 $\lambda$ 的重数 $= \sum_i n_i$（所有相关块大小之和）

例子（所有特征值仅 $\lambda = 5$，代数重数 $4$）：

$J_4(5)$：$m_T = (z-5)^4$，$p_T = (z-5)^4$（相等）
$J_2(5) \oplus J_2(5)$：$m_T = (z-5)^2$，$p_T = (z-5)^4$
$J_3(5) \oplus [5]$：$m_T = (z-5)^3$，$p_T = (z-5)^4$
$5 I_4$（对角）：$m_T = (z-5)$，$p_T = (z-5)^4$

$m_T$ 精准告诉你"最大 Jordan 块多大"——这是 $p_T$ 看不到的结构。由 (a) 和 Cayley-Hamilton，$p_T(T) = 0$，所以 $m_T | p_T$ 马上可得（次数最低性）。

可对角化的最终判据：$m_T$ 无重根

把 Ch 5D 的五等价条件 (5.55) 重新挂出来——最优美的是第 (5) 条：

判据. $T$ 可对角化 $\iff m_T$ 可写成互不相同一次因子之积： $$ m_T(z) \;=\; (z - \lambda_1)(z - \lambda_2) \cdots (z - \lambda_m). $$

为什么（Jordan 视角）：由 Q11，$m_T$ 中 $\lambda$ 的重数 = 与 $\lambda$ 对应的最大 Jordan 块大小。所以

$m_T$ 无重根 $\iff$ 每个 $\lambda$ 的最大 Jordan 块大小 = 1 $\iff$ 所有 Jordan 块都是 $1 \times 1$ $\iff$ Jordan 形即对角形 $\iff T$ 可对角化

例子对比：

$\operatorname{diag}(2, 2, 3)$：$p_T = (z-2)^2(z-3)$，但 $m_T = (z-2)(z-3)$ ✅ 无重根 → 可对角化
$\bigl(\begin{smallmatrix}2&1\\0&2\end{smallmatrix}\bigr)$：$p_T = m_T = (z-2)^2$ ❌ 重根 → 不可对角化
投影 $P$（$P^2 = P$）：$m_T | z^2 - z = z(z-1)$ → 无重根 → ✅ 总可对角化
对合 $T$（$T^2 = I$）：$m_T | z^2 - 1 = (z-1)(z+1)$ → 无重根 → ✅ 总可对角化

实战诀窍："证 $T$ 可对角化"的最轻量路径：找任何一个没有重根且 $T$ 满足的多项式 $p$，则 $m_T | p$，故 $m_T$ 也没重根，结束。这个套路避开了显式计算特征向量。

Ch 8 要记住的"底子定理"

8.10 定义. $G(\lambda, T) = \operatorname{null}(T - \lambda I)^{\dim V}$：广义特征空间，包含 $E(\lambda, T)$

8.13 / 8.21 分解. 复向量空间 $V = G(\lambda_1, T) \oplus \cdots \oplus G(\lambda_m, T)$；$T|_{G_j} - \lambda_j I$ 是幂零算子

8.18 幂零. 若 $N$ 幂零、$\dim V = n$，则 $N^n = 0$。唯一特征值 $0$

8.26 重数. 代数重数 $=\dim G(\lambda, T)$；几何重数 $=\dim E(\lambda, T)$；$1 \leq$ 几何 $\leq$ 代数

8.37 Cayley-Hamilton. $p_T(T) = 0$：每个算子被自己的特征多项式零化

8.60 Jordan 形. 每个复算子相似于 $\bigoplus_i J_{n_i}(\lambda_i)$，块的多重集唯一

可对角化判据. $T$ 可对角化 $\iff m_T$ 无重根 $\iff$ Jordan 形全是 $1\times 1$ 块

Axler Ch 8 习题（pp.260-294）

Ex 8.A-3：证幂零算子唯一特征值 $0$（见 E2）
Ex 8.B-9：$m_T = p_T \iff$ 每个特征值只有一个 Jordan 块
Ex 8.C-1：$\dim G(\lambda, T) =$ $\lambda$ 的代数重数（证明核心：用 8.21 + 幂零指数）

Ch 8 在工程里干嘛用？（ODE + 矩阵指数）

Jordan 形最重要的应用：线性常微分方程组。

线性 ODE $\dot x = Ax$ 的通解

考虑 $n$ 维线性 ODE $\dot x = Ax$，$A \in \mathbf{R}^{n \times n}$。形式解 $x(t) = e^{tA} x(0)$，其中矩阵指数

$\displaystyle e^{tA} \;=\; \sum_{k=0}^{\infty} \frac{t^k A^k}{k!} \;=\; I + tA + \tfrac{t^2}{2} A^2 + \tfrac{t^3}{6} A^3 + \cdots$

若 $A$ 可对角化（Ch 5D）：$A = P D P^{-1}$，$e^{tA} = P e^{tD} P^{-1}$，$e^{tD}$ 对角，每个对角元是 $e^{\lambda_i t}$。通解 $x(t) = \sum_i c_i e^{\lambda_i t} v_i$——纯指数模式。

若 $A$ 不可对角化（本章主角）：把 $A$ 放到 Jordan 形 $A = P J P^{-1}$。对单块 $J_n(\lambda) = \lambda I + N_n$，由 $\lambda I$ 与 $N_n$ 可交换：

$e^{t J_n(\lambda)} \;=\; e^{\lambda t} \cdot e^{t N_n} \;=\; e^{\lambda t} \bigl(I + t N_n + \tfrac{t^2}{2} N_n^2 + \cdots + \tfrac{t^{n-1}}{(n-1)!} N_n^{n-1}\bigr)$

（因 $N_n^n = 0$ 级数终止在第 $n-1$ 项。）展开成矩阵：

$e^{t J_n(\lambda)} \;=\; e^{\lambda t}\begin{pmatrix} 1 & t & \tfrac{t^2}{2} & \cdots & \tfrac{t^{n-1}}{(n-1)!} \\ 0 & 1 & t & \cdots & \tfrac{t^{n-2}}{(n-2)!} \\ \vdots & & \ddots & & \vdots \\ 0 & 0 & 0 & \cdots & 1 \end{pmatrix}$

通解形式是 $t^k e^{\lambda t}$ 的组合，其中 $k = 0, 1, \ldots, n-1$（Jordan 块大小 $-1$）。这就是 ODE 教材说的"重根对应 $t e^{\lambda t}, t^2 e^{\lambda t}, \ldots$"的代数根据——$t^k$ 因子恰好对应 Jordan 块的大小。

稳定性分析

$\dot x = Ax$ 的零解 $x \equiv 0$ 的渐近稳定性由 $A$ 的特征值决定：

所有 $\operatorname{Re} \lambda_i < 0$：渐近稳定（指数衰减压倒 $t^k$ 多项式增长）
存在 $\operatorname{Re} \lambda_i > 0$：不稳定
$\operatorname{Re} \lambda_i \leq 0$ 全成立，但某 $\lambda_i$ 纯虚 ($\operatorname{Re} \lambda_i = 0$) 对应 Jordan 块大小 $\geq 2$：多项式不稳定（$t^k$ 项让解发散）

最后一条是 Jordan 结构的真·相关——仅凭特征值看不到，必须知道块的大小。控制理论、结构振动、电路分析全都用这个判据。

快速数值算 $e^{tA}$ 的套路

直接级数展开要无穷项；用 Jordan 形或等价的 Schur 分解（数值上更稳定）把 $e^{tA}$ 归约到算 $e^{\lambda t}(1 + t + \cdots)$ 的块对角问题，然后合回去。MATLAB 的 expm、SciPy 的 scipy.linalg.expm 本质上都在算这个。

Ch 8 搞懂后，下一步？

两条路，都很重要：

Ch 9 行列式：前 8 章完全不依赖行列式建立了特征值/Jordan 形。Ch 9 把 $\det A$ 从"求和公式"重新诠释为有符号 $n$ 维体积——"体积放大倍数"的代数化。$\det(T - zI)$ 就是 Jordan 形里对角元的乘积 $= \prod \lambda_i^{d_i}$，与 $p_T(z)$ 对齐
Ch 10 多线性代数 / 张量代数：把"多个向量作用"推广成多线性形式、外代数 $\Lambda^k V$。行列式作为 $\dim V$ 重反对称多线性形式；外代数统一了行列式、向量积（叉积）、体积元

做完 Ch 9 后你会看到 Axler 整本书的结构美学："算子 → 特征值 → 广义特征空间 → Jordan → 行列式（作为 $\prod \lambda_i$）"。线性代数的每个概念自然出现，无任何 ad hoc 公式——这也是这本书区别于传统教材的根本。

面向应用：Jordan 形本身很少在数值计算里直接用（数值不稳定，微小扰动就破坏块结构），但它是理论工具——证明控制理论、线性系统、PDE 正则性、矩阵方程的底子。实务中常用Schur 分解（$A = Q T Q^*$，$T$ 上三角）作为数值稳定替代品，Schur 的对角元仍然是特征值，部分保留了 Jordan 的层级信息。

★ 轮到你了——自测 8 题

每题先独立想 3 分钟再看答案。难度：★ 概念／简单计算 · ★★ 证明 · ★★★ 综合／开放。

E1 ★算 Jordan 形：下列矩阵的 Jordan 形是什么？

(a) $\bigl(\begin{smallmatrix}3&1\\0&3\end{smallmatrix}\bigr)$ (b) $\bigl(\begin{smallmatrix}2&0\\0&2\end{smallmatrix}\bigr)$ (c) $\bigl(\begin{smallmatrix}5&0\\0&7\end{smallmatrix}\bigr)$ (d) $\bigl(\begin{smallmatrix}0&1&0\\0&0&1\\0&0&0\end{smallmatrix}\bigr)$

提示

对每个矩阵先算特征多项式 → 特征值 → 每个 $\lambda$ 的几何重数 → 组合成 Jordan 块。记住：几何重数 = 块个数，代数重数 = 块大小和。

答案

(a) $J_2(3)$。$p = (z-3)^2$，$E(3)$ 维数 $1$，故 $1$ 个大小 $2$ 的块。

(b) $[2] \oplus [2] = 2I_2$。$p = (z-2)^2$，$E(2) = \mathbf{R}^2$ 维数 $2$，故 $2$ 个大小 $1$ 的块。(b) 与 (a) 特征多项式相同但 Jordan 形不同——这就是 $p_T$ 无法区分的精细结构。

(c) $[5] \oplus [7]$。已经对角。

(d) $J_3(0)$。$p = z^3$，$\operatorname{null}(T) = \operatorname{span}\{e_1\}$ 维数 $1$，故 $1$ 个大小 $3$ 的 $0$-块——这正是标准 $3$ 阶幂零。

E2 ★证：幂零算子的唯一特征值是 $0$

设 $N \in \mathcal{L}(V)$ 幂零，幂零指数 $k$。证 $N$ 的所有特征值都是 $0$。

提示

若 $Nv = \lambda v$，$v \neq 0$，对 $N^k v$ 双边计算。

答案

设 $Nv = \lambda v$，$v \neq 0$。则 $N^k v = \lambda^k v$（归纳：$N^j v = \lambda^j v$）。

另一方面 $N^k = 0$，所以 $N^k v = 0$。

故 $\lambda^k v = 0$。因 $v \neq 0$，得 $\lambda^k = 0 \Rightarrow \lambda = 0$。∎

反向：若 $N$ 的唯一特征值是 $0$（且在 $\mathbf{C}$ 上），则由 8.21 $V = G(0, N)$ 整个是 $0$ 的广义特征空间，所以 $N^{\dim V} = 0$，即 $N$ 幂零。两者等价。

E3 ★★证：$J_n(\lambda)$ 的最小多项式是 $(z - \lambda)^n$

设 $J = J_n(\lambda)$ 是 $n$ 阶 Jordan 块。证 $m_J(z) = (z - \lambda)^n$。

提示

算 $(J - \lambda I)^k = N_n^k$，看哪个 $k$ 开始为 $0$。$N_n$ 的作用是"把基右移一位"。

答案

令 $N = J - \lambda I$。在标准基 $e_1, \ldots, e_n$ 下 $N e_i = e_{i-1}$（$i \geq 2$）、$N e_1 = 0$。

$N^k e_i = e_{i - k}$（当 $i > k$，否则为 $0$）。特别 $N^{n-1} e_n = e_1 \neq 0$，所以 $N^{n-1} \neq 0$。

$N^n e_i = 0$ 对所有 $i$（$e_i$ 被右移 $n$ 步出界），所以 $N^n = 0$。

故 $(z - \lambda)^n$ 是零化多项式，$(z - \lambda)^{n-1}$ 不是——$(z - \lambda)^n$ 是最小的（因为任何低次零化多项式必须是 $(z - \lambda)^k$ 形式——$J$ 唯一特征值 $\lambda$，$m_J$ 的根集 = 特征值集）。

结论 $m_J(z) = (z - \lambda)^n$。同时 $p_J(z) = (z - \lambda)^n$，两者一致——这是 $J_n(\lambda)$ 单块的特征。∎

E4 ★★用 Cayley-Hamilton 算 $A^{-1}$

设 $A = \bigl(\begin{smallmatrix}2&1\\0&3\end{smallmatrix}\bigr)$。用 $p_A(A) = 0$ 推出 $A^{-1}$。

提示

$p_A(z) = (z - 2)(z - 3) = z^2 - 5z + 6$。由 C-H，$A^2 - 5A + 6I = 0$。整理出 $A \cdot (?) = I$。

答案

$p_A(z) = z^2 - 5z + 6$。Cayley-Hamilton：$A^2 - 5A + 6I = 0 \Rightarrow 6I = 5A - A^2 = A(5I - A)$。

所以 $A^{-1} = \frac{1}{6}(5I - A) = \frac{1}{6}\begin{pmatrix}5 - 2 & -1 \\ 0 & 5 - 3\end{pmatrix} = \frac{1}{6}\begin{pmatrix}3 & -1 \\ 0 & 2\end{pmatrix} = \begin{pmatrix}1/2 & -1/6 \\ 0 & 1/3\end{pmatrix}$.

验：$A A^{-1} = \bigl(\begin{smallmatrix}2&1\\0&3\end{smallmatrix}\bigr)\bigl(\begin{smallmatrix}1/2&-1/6\\0&1/3\end{smallmatrix}\bigr) = \bigl(\begin{smallmatrix}1&-1/3+1/3\\0&1\end{smallmatrix}\bigr) = I$ ✓

E5 ★★区分两个代数重数相同但 Jordan 形不同的矩阵

设 $A = \bigl(\begin{smallmatrix}5&0\\0&5\end{smallmatrix}\bigr)$、$B = \bigl(\begin{smallmatrix}5&1\\0&5\end{smallmatrix}\bigr)$。两者特征多项式都是 $(z-5)^2$。证 $A, B$ 不相似（即 $\nexists$ 可逆 $P$ 使 $P^{-1}AP = B$）。

提示

找一个相似不变量能区分它们——例如 $\operatorname{rank}(A - 5I)$ vs $\operatorname{rank}(B - 5I)$，或 $\dim E(5, \cdot)$。

答案

若 $P^{-1} A P = B$，则 $P^{-1}(A - 5I)P = B - 5I$（同时减 $5I$）。相似变换保秩，所以 $\operatorname{rank}(A - 5I) = \operatorname{rank}(B - 5I)$。

算：$A - 5I = 0_{2\times 2}$，秩 $0$；$B - 5I = \bigl(\begin{smallmatrix}0&1\\0&0\end{smallmatrix}\bigr)$，秩 $1$。

$0 \neq 1$，矛盾。故 $A \not\sim B$。∎

Jordan 形语言：$A$ 的 Jordan 形是 $[5] \oplus [5]$（两个 $1 \times 1$ 块），$B$ 的是 $J_2(5)$（一个 $2 \times 2$ 块）。Jordan 形的唯一性（8.60）直接给出它们不相似。

E6 ★★证：若 $T^3 = T$，则 $T$ 可对角化

设 $T \in \mathcal{L}(V)$ 满足 $T^3 = T$（特征值 $\in \{0, 1, -1\}$）。证 $T$ 可对角化。

提示

找一个没有重根的零化多项式。最小多项式必须整除它。

答案

$T^3 - T = T(T - I)(T + I) = 0$，即 $p(z) = z(z-1)(z+1)$ 是 $T$ 的零化多项式。

$p$ 有三个不同的根 $0, 1, -1$——无重根。

最小多项式 $m_T | p$（最小多项式整除任何零化多项式）。所以 $m_T$ 也没有重根（是 $p$ 的一次因子的子积）。

由 Q12 判据，$T$ 可对角化。∎

进一步：$V = E(0, T) \oplus E(1, T) \oplus E(-1, T)$（对应 $m_T$ 的根），分别是 $\operatorname{null} T$、$\operatorname{null}(T-I)$、$\operatorname{null}(T+I)$。

E7 ★★ODE 里 $t e^{\lambda t}$ 的来源：解 $\dot x = J_2(1) x$

解 $\dot x = Jx$，其中 $J = J_2(1) = \bigl(\begin{smallmatrix}1&1\\0&1\end{smallmatrix}\bigr)$，初值 $x(0) = (x_0, y_0)^\top$。

提示

用 $e^{tJ} = e^{t(I + N)} = e^t \cdot e^{tN}$，$N = \bigl(\begin{smallmatrix}0&1\\0&0\end{smallmatrix}\bigr)$，$N^2 = 0$ 所以 $e^{tN} = I + tN$。

答案

$J = I + N$，$N = \bigl(\begin{smallmatrix}0&1\\0&0\end{smallmatrix}\bigr)$，$N^2 = 0$。因 $I$ 与 $N$ 可交换：

$e^{tJ} = e^{tI} e^{tN} = e^t \cdot (I + tN) = \bigl(\begin{smallmatrix}e^t & t e^t \\ 0 & e^t\end{smallmatrix}\bigr)$。

故 $x(t) = e^{tJ} x(0) = \bigl(\begin{smallmatrix}e^t x_0 + t e^t y_0 \\ e^t y_0\end{smallmatrix}\bigr) = e^t \bigl(\begin{smallmatrix}x_0 + t y_0 \\ y_0\end{smallmatrix}\bigr)$.

观察：第一分量出现 $t e^t$——指数 $\times$ 线性因子。这就是 ODE 课里"重根导致 $te^{\lambda t}$ 项"的完整代数解释，$t$ 的幂 = Jordan 块大小 $- 1$。

E8 ★★★Jordan 反工程：从 $\operatorname{null}(T - \lambda I)^k$ 的维数恢复块大小

设 $T$ 作用于 $\mathbf{C}^6$ 上，唯一特征值是 $\lambda = 2$，且 $\dim \operatorname{null}(T - 2I) = 3$、$\dim \operatorname{null}(T - 2I)^2 = 5$、$\dim \operatorname{null}(T - 2I)^3 = 6$（稳定）。问 $T$ 的 Jordan 形是什么？

提示

大小 $\geq k$ 的块个数 $= \dim \operatorname{null}(T - \lambda I)^k - \dim \operatorname{null}(T - \lambda I)^{k-1}$。逐个算出"大小 $\geq 1, 2, 3, \ldots$"的块个数。

答案

设 $d_k = \dim \operatorname{null}(T - 2I)^k$，则 $d_0 = 0, d_1 = 3, d_2 = 5, d_3 = 6, d_k = 6$（$k \geq 3$）。

大小 $\geq k$ 的块个数 $= d_k - d_{k-1}$：

大小 $\geq 1$：$d_1 - d_0 = 3$（共 $3$ 个块）
大小 $\geq 2$：$d_2 - d_1 = 2$（其中 $2$ 个块大小 $\geq 2$）
大小 $\geq 3$：$d_3 - d_2 = 1$（$1$ 个块大小 $\geq 3$）
大小 $\geq 4$：$d_4 - d_3 = 0$（无）

故块大小分布（用差分）：

大小恰为 $3$：$1 - 0 = 1$ 个
大小恰为 $2$：$2 - 1 = 1$ 个
大小恰为 $1$：$3 - 2 = 1$ 个

Jordan 形 $= J_3(2) \oplus J_2(2) \oplus J_1(2)$，总维 $= 3 + 2 + 1 = 6$ ✓

验：几何重数 $= $ 块个数 $= 3 = d_1$ ✓；代数重数 $= $ 总维 $= 6$ ✓；$m_T(z) = (z - 2)^3$（最大块大小）。

完成度自检：E1-E2 通 = 会识别 Jordan 形；E3-E5 证明 = 理解唯一性；E6-E8 搞定 = 能操作最小多项式、ODE 应用、反工程——准备好读 Ch 9。E8 的"从 null 空间维数恢复 Jordan"是所有 Jordan 判据背后的机械过程，值得刻在肌肉记忆里。

Ch 8 Generalized Eigenvectors and Jordan Form · Axler 4e · pp.260–294

0 · 符号对照