矩阵的秩:从定义到应用的全面解析

在线性代数的广阔领域中,矩阵是连接代数运算与几何直观的核心工具,而矩阵的秩(Rank of a Matrix)则是矩阵最本质的属性之一。它如同矩阵的“DNA”,浓缩了矩阵所代表的线性变换、数据结构或系统关系的关键信息。无论是解线性方程组、分析线性变换的特性,还是在数据科学、图像处理、机器学习等现代应用中,秩都扮演着不可或缺的角色。

想象一个场景:工程师需要通过一组实验数据确定一个物理系统的状态,这些数据被整理成一个矩阵;数据分析师希望从高维数据中提取关键特征,剔除冗余信息;计算机科学家试图压缩图像或视频以减少存储开销——这些问题的背后,都离不开对矩阵秩的理解与应用。秩揭示了矩阵中行(或列)向量的“独立程度”,决定了线性方程组解的存在性与唯一性,刻画了线性变换的“有效维度”,甚至能衡量数据的“信息量”。

本文将从秩的基本定义出发,逐步深入其性质、计算方法、几何意义,并通过丰富的例子与应用场景,帮助读者构建对秩的完整认知。无论你是初次接触线性代数的学生,还是希望深化知识的研究者,相信这篇文章都能为你提供清晰且实用的指导。

目录#

  1. 定义:秩的多重面孔

    • 1.1 行秩与列秩
    • 1.2 行阶梯形矩阵与秩
    • 1.3 子式与秩的代数定义
    • 1.4 秩的等价性:为何行秩=列秩?
    • 1.5 特殊矩阵的秩(零矩阵、单位矩阵等)
  2. 性质:秩的“行为准则”

    • 2.1 基本性质(非负性、有界性等)
    • 2.2 转置不变性:rank(A)=rank(AT)\text{rank}(A) = \text{rank}(A^T)
    • 2.3 数乘与秩:rank(kA)=rank(A)\text{rank}(kA) = \text{rank}(A)k0k \neq 0
    • 2.4 和与差的秩:rank(A±B)rank(A)+rank(B)\text{rank}(A \pm B) \leq \text{rank}(A) + \text{rank}(B)
    • 2.5 乘积的秩:rank(AB)min(rank(A),rank(B))\text{rank}(AB) \leq \min(\text{rank}(A), \text{rank}(B))
    • 2.6 Sylvester不等式与Frobenius不等式
    • 2.7 秩-零度定理(Rank-Nullity Theorem)
  3. 计算方法:如何求矩阵的秩?

    • 3.1 行阶梯形法(高斯消元法):步骤与示例
    • 3.2 子式法:从高阶到低阶的搜索
    • 3.3 行列式法(仅适用于方阵)
    • 3.4 工具辅助:Python与MATLAB中的秩计算
  4. 几何意义:秩如何“塑造”空间?

    • 4.1 行空间与列空间的维度
    • 4.2 秩与线性相关性:基与张成空间
    • 4.3 低维示例:秩1、秩2的几何直观
    • 4.4 线性变换视角:秩与像空间的维度
  5. 应用:秩在现实问题中的作用

    • 5.1 线性方程组:解的存在性与唯一性
    • 5.2 线性变换:满射、单射与秩的关系
    • 5.3 数据科学:主成分分析(PCA)与低秩近似
    • 5.4 图像处理:基于低秩的图像压缩
    • 5.5 机器学习:矩阵分解与协同过滤
  6. 示例解析:从理论到实践

    • 6.1 基础示例:2x2、3x3矩阵的秩计算
    • 6.2 进阶示例:应用秩的性质解题
    • 6.3 综合示例:线性方程组与秩的关系
  7. 常见误区与澄清

    • 7.1 误区1:秩是“非零元素的个数”?
    • 7.2 误区2:只有方阵才有秩?
    • 7.3 误区3:秩与行列式“绑定”?
    • 7.4 误区4:行阶梯形中“非零行”一定是行秩?
  8. 进阶话题(选读)

    • 8.1 低秩近似与奇异值分解(SVD)
    • 8.2 无限维空间中的秩
    • 8.3 张量的秩:从矩阵到高维数组
  9. 总结

  10. 参考文献

1. 定义:秩的多重面孔#

1.1 行秩与列秩#

矩阵的秩起源于对“独立信息”的刻画。直观地说,秩反映了矩阵中行(或列)向量所包含的“有效维度”。我们从两个基本概念入手:

  • 行秩(Row Rank):矩阵的行向量组的秩,即行向量组中线性无关向量的最大个数。
  • 列秩(Column Rank):矩阵的列向量组的秩,即列向量组中线性无关向量的最大个数。

例1:考虑矩阵 A=(123246)A = \begin{pmatrix} 1 & 2 & 3 \\ 2 & 4 & 6 \end{pmatrix}
行向量组为 α1=(1,2,3)\alpha_1 = (1, 2, 3)α2=(2,4,6)\alpha_2 = (2, 4, 6)。由于 α2=2α1\alpha_2 = 2\alpha_1,行向量组线性相关,故行秩为1。
列向量组为 β1=(1,2)T\beta_1 = (1, 2)^Tβ2=(2,4)T\beta_2 = (2, 4)^Tβ3=(3,6)T\beta_3 = (3, 6)^T。同理,β2=2β1\beta_2 = 2\beta_1β3=3β1\beta_3 = 3\beta_1,列向量组线性相关,列秩也为1。

1.2 行阶梯形矩阵与秩#

行阶梯形矩阵(Row Echelon Form, REF) 是一种特殊的矩阵形式,其满足:

  1. 非零行(至少有一个非零元素的行)均位于零行(全零元素的行)上方;
  2. 对于非零行,从左起第一个非零元素(称为“主元”或“ pivot”)的列标,严格大于上一行主元的列标。

定义:矩阵的秩等于其行阶梯形矩阵中非零行的个数。

例2:将例1中的矩阵 AA 化为行阶梯形:
A=(123246)r22r1(123000)A = \begin{pmatrix} 1 & 2 & 3 \\ 2 & 4 & 6 \end{pmatrix} \xrightarrow{r_2 - 2r_1} \begin{pmatrix} 1 & 2 & 3 \\ 0 & 0 & 0 \end{pmatrix}(行阶梯形),非零行个数为1,故 rank(A)=1\text{rank}(A) = 1

1.3 子式与秩的代数定义#

子式(Minor):对于 m×nm \times n 矩阵 AA,任取 kkkk 列(1kmin(m,n)1 \leq k \leq \min(m, n)),交叉处元素构成的 kk 阶行列式称为 AAkk 阶子式。

定义:矩阵 AA 的秩是其非零子式的最高阶数,记为 rank(A)\text{rank}(A)r(A)r(A)

例3:矩阵 A=(1234)A = \begin{pmatrix} 1 & 2 \\ 3 & 4 \end{pmatrix} 的2阶子式为 det(A)=1×42×3=20\det(A) = 1 \times 4 - 2 \times 3 = -2 \neq 0,故 rank(A)=2\text{rank}(A) = 2

1.4 秩的等价性:为何行秩=列秩?#

一个深刻的结论是:任何矩阵的行秩等于列秩。因此,我们可以统一称为“矩阵的秩”。

直观解释:行阶梯形矩阵的行秩等于非零行个数,而列秩等于主元列个数(含主元的列)。由于主元列是线性无关的,且其他列可由主元列线性表示,故列秩也等于非零行个数,即行秩=列秩。

代数证明(子式角度):若 AA 的行秩为 rr,则存在 rr 个线性无关行向量,它们张成的子矩阵的列秩也为 rr(因行秩=列秩对该子矩阵成立),故 AA 的列秩至少为 rr;同理可证行秩至少等于列秩,因此两者相等。

1.5 特殊矩阵的秩#

  • 零矩阵:所有元素均为0的矩阵,其所有子式均为0,故 rank(O)=0\text{rank}(O) = 0
  • 单位矩阵nn 阶单位矩阵 InI_nnn 阶子式 det(In)=10\det(I_n) = 1 \neq 0,故 rank(In)=n\text{rank}(I_n) = n(满秩)。
  • 秩1矩阵:可表示为 A=uvTA = uv^Tu,vu, v 为非零向量),其所有2阶子式均为0,且1阶子式非零,故 rank(A)=1\text{rank}(A) = 1

2. 性质:秩的“行为准则”#

2.1 基本性质#

  • 非负性rank(A)0\text{rank}(A) \geq 0,且 rank(A)=0    A=O\text{rank}(A) = 0 \iff A = O
  • 有界性:对 m×nm \times n 矩阵 AA0rank(A)min(m,n)0 \leq \text{rank}(A) \leq \min(m, n)。若 rank(A)=min(m,n)\text{rank}(A) = \min(m, n),称 AA满秩矩阵

2.2 转置不变性:rank(A)=rank(AT)\text{rank}(A) = \text{rank}(A^T)#

证明AAkk 阶子式与 ATA^Tkk 阶子式互为转置行列式,而行列式转置后值不变。因此,AAATA^T 的非零子式最高阶数相同,即秩相等。

2.3 数乘与秩:rank(kA)=rank(A)\text{rank}(kA) = \text{rank}(A)k0k \neq 0#

证明kAkAkk 阶子式为 krk^r 乘以 AAkk 阶子式(rr 为子式阶数)。由于 k0k \neq 0kAkAAA 的非零子式最高阶数相同,故秩不变。

2.4 和与差的秩:rank(A±B)rank(A)+rank(B)\text{rank}(A \pm B) \leq \text{rank}(A) + \text{rank}(B)#

直观解释A±BA \pm B 的行向量可由 AABB 的行向量线性表示,故其行秩不超过 AABB 的行秩之和。

例4:设 A=(1000)A = \begin{pmatrix} 1 & 0 \\ 0 & 0 \end{pmatrix}B=(0001)B = \begin{pmatrix} 0 & 0 \\ 0 & 1 \end{pmatrix},则 rank(A)=rank(B)=1\text{rank}(A) = \text{rank}(B) = 1rank(A+B)=2=1+1\text{rank}(A+B) = 2 = 1+1,取等号;若 B=AB = A,则 rank(A+B)=rank(2A)=1<1+1\text{rank}(A+B) = \text{rank}(2A) = 1 < 1+1,取不等号。

2.5 乘积的秩:rank(AB)min(rank(A),rank(B))\text{rank}(AB) \leq \min(\text{rank}(A), \text{rank}(B))#

几何解释:矩阵乘法 ABAB 可视为先进行 BB 对应的线性变换,再进行 AA 对应的变换。像空间的维度不会超过前一个变换的像空间维度(rank(B)\text{rank}(B)),也不会超过 AA 的像空间维度(rank(A)\text{rank}(A))。

例5A=(1000)A = \begin{pmatrix} 1 & 0 \\ 0 & 0 \end{pmatrix}rank(A)=1\text{rank}(A)=1),B=(0100)B = \begin{pmatrix} 0 & 1 \\ 0 & 0 \end{pmatrix}rank(B)=1\text{rank}(B)=1),则 AB=(0100)AB = \begin{pmatrix} 0 & 1 \\ 0 & 0 \end{pmatrix}rank(AB)=1min(1,1)\text{rank}(AB)=1 \leq \min(1,1));BA=OBA = Orank(BA)=01\text{rank}(BA)=0 \leq 1)。

2.6 Sylvester不等式与Frobenius不等式#

  • Sylvester不等式:对 m×nm \times n 矩阵 AAn×pn \times p 矩阵 BB,有
    rank(A)+rank(B)nrank(AB)\text{rank}(A) + \text{rank}(B) - n \leq \text{rank}(AB)
    等号条件:当 AABB 分别为列满秩和行满秩时,rank(AB)=rank(A)=rank(B)\text{rank}(AB) = \text{rank}(A) = \text{rank}(B)

  • Frobenius不等式:对 A,B,CA, B, C 可乘矩阵,有
    rank(ABC)rank(AB)+rank(BC)rank(B)\text{rank}(ABC) \geq \text{rank}(AB) + \text{rank}(BC) - \text{rank}(B)

2.7 秩-零度定理(Rank-Nullity Theorem)#

零度(Nullity):矩阵 AA 的零空间(解空间 Ax=0Ax = 0)的维度,记为 nullity(A)\text{nullity}(A)

定理:对 m×nm \times n 矩阵 AA,有
rank(A)+nullity(A)=n\text{rank}(A) + \text{nullity}(A) = n

意义:列数(变量数)= 秩(独立方程数)+ 零度(自由变量数)。这是线性代数中连接代数与几何的核心定理。

例6A=(123246)A = \begin{pmatrix} 1 & 2 & 3 \\ 2 & 4 & 6 \end{pmatrix}rank(A)=1\text{rank}(A)=1n=3n=3),则 nullity(A)=31=2\text{nullity}(A) = 3 - 1 = 2,即 Ax=0Ax=0 的解空间是2维的(平面)。

3. 计算方法:如何求矩阵的秩?#

3.1 行阶梯形法(高斯消元法):步骤与示例#

核心思想:通过初等行变换将矩阵化为行阶梯形,非零行个数即为秩。

初等行变换

  1. 换行:交换两行(不改变秩);
  2. 倍乘:某行乘以非零常数(不改变秩);
  3. 倍加:某行加上另一行的倍数(不改变秩)。

步骤

  1. 从左到右、从上到下寻找主元列(首个非零列);
  2. 选非零行作为首行,将主元下方元素消为0;
  3. 对剩余子矩阵重复上述步骤,直至化为行阶梯形。

例7:求 A=(123424683579)A = \begin{pmatrix} 1 & 2 & 3 & 4 \\ 2 & 4 & 6 & 8 \\ 3 & 5 & 7 & 9 \end{pmatrix} 的秩。

Ar22r1(123400003579)r33r1(123400000123)r2r3(123401230000)A \xrightarrow{r_2 - 2r_1} \begin{pmatrix} 1 & 2 & 3 & 4 \\ 0 & 0 & 0 & 0 \\ 3 & 5 & 7 & 9 \end{pmatrix} \xrightarrow{r_3 - 3r_1} \begin{pmatrix} 1 & 2 & 3 & 4 \\ 0 & 0 & 0 & 0 \\ 0 & -1 & -2 & -3 \end{pmatrix} \xrightarrow{r_2 \leftrightarrow r_3} \begin{pmatrix} 1 & 2 & 3 & 4 \\ 0 & -1 & -2 & -3 \\ 0 & 0 & 0 & 0 \end{pmatrix}(行阶梯形),非零行个数为2,故 rank(A)=2\text{rank}(A) = 2

3.2 子式法:从高阶到低阶的搜索#

步骤

  1. 计算 min(m,n)\min(m, n) 阶子式,若存在非零,秩为 min(m,n)\min(m, n)
  2. 否则,计算 min(m,n)1\min(m, n)-1 阶子式,若存在非零,秩为 min(m,n)1\min(m, n)-1
  3. 重复直至找到非零子式或确定秩为0。

例8:求 A=(112224335)A = \begin{pmatrix} 1 & 1 & 2 \\ 2 & 2 & 4 \\ 3 & 3 & 5 \end{pmatrix} 的秩。
:3阶子式 det(A)=0\det(A) = 0(前两列成比例);2阶子式 1235=56=10\begin{vmatrix} 1 & 2 \\ 3 & 5 \end{vmatrix} = 5 - 6 = -1 \neq 0,故 rank(A)=2\text{rank}(A) = 2

3.3 行列式法(仅适用于方阵)#

对于 nn 阶方阵 AA

  • det(A)0\det(A) \neq 0(非奇异),则 rank(A)=n\text{rank}(A) = n
  • det(A)=0\det(A) = 0(奇异),则 rank(A)<n\text{rank}(A) < n,需进一步判断低阶子式。

3.4 工具辅助:Python与MATLAB中的秩计算#

Python(NumPy)

import numpy as np
A = np.array([[1, 2, 3], [2, 4, 6], [3, 5, 7]])
print(np.linalg.matrix_rank(A))  # 输出:2

MATLAB

A = [1 2 3; 2 4 6; 3 5 7];
rank(A)  % 输出:2

4. 几何意义:秩如何“塑造”空间?#

4.1 行空间与列空间的维度#

  • 行空间(Row Space):矩阵 AA 的行向量张成的向量空间,记为 Row(A)\text{Row}(A),其维度 dim(Row(A))=rank(A)\dim(\text{Row}(A)) = \text{rank}(A)
  • 列空间(Column Space):矩阵 AA 的列向量张成的向量空间,记为 Col(A)\text{Col}(A),其维度 dim(Col(A))=rank(A)\dim(\text{Col}(A)) = \text{rank}(A)

例9A=(1234)A = \begin{pmatrix} 1 & 2 \\ 3 & 4 \end{pmatrix} 的行空间是 R2\mathbb{R}^2(因行向量线性无关),列空间也是 R2\mathbb{R}^2,故 dim(Row(A))=dim(Col(A))=2=rank(A)\dim(\text{Row}(A)) = \dim(\text{Col}(A)) = 2 = \text{rank}(A)

4.2 秩与线性相关性:基与张成空间#

矩阵的秩本质上是其行(列)向量组的极大线性无关组的大小。极大无关组构成行(列)空间的一组基,而其他向量可由基线性表示。

例10:矩阵 A=(101011112)A = \begin{pmatrix} 1 & 0 & 1 \\ 0 & 1 & 1 \\ 1 & 1 & 2 \end{pmatrix} 的行向量组为 α1=(1,0,1),α2=(0,1,1),α3=(1,1,2)\alpha_1=(1,0,1), \alpha_2=(0,1,1), \alpha_3=(1,1,2)。由于 α3=α1+α2\alpha_3 = \alpha_1 + \alpha_2,极大无关组为 {α1,α2}\{\alpha_1, \alpha_2\},故 rank(A)=2\text{rank}(A) = 2,行空间是由 α1,α2\alpha_1, \alpha_2 张成的平面(2维子空间)。

4.3 低维示例:秩1、秩2的几何直观#

  • 秩1矩阵:行空间与列空间均为1维(直线)。例如,A=(123246)A = \begin{pmatrix} 1 & 2 & 3 \\ 2 & 4 & 6 \end{pmatrix} 的行空间是 span{(1,2,3)}\text{span}\{(1,2,3)\}(一条直线),列空间是 span{(1,2)}\text{span}\{(1,2)\}(另一条直线)。
  • 秩2矩阵(3x3):行空间/列空间是 R3\mathbb{R}^3 中的平面。例如,A=(100010110)A = \begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 1 & 1 & 0 \end{pmatrix} 的列空间是 xyxy 平面(span{(1,0,1),(0,1,1)}\text{span}\{(1,0,1), (0,1,1)\}),秩为2。

4.4 线性变换视角:秩与像空间的维度#

矩阵 Am×nA_{m \times n} 可表示从 Rn\mathbb{R}^nRm\mathbb{R}^m 的线性变换 T(x)=AxT(x) = Ax。此时:

  • 像空间(Image Space)TT 的像空间即 AA 的列空间,dim(Image(T))=rank(A)\dim(\text{Image}(T)) = \text{rank}(A)
  • 核空间(Kernel Space)TT 的核空间即 AA 的零空间,dim(Kernel(T))=nullity(A)\dim(\text{Kernel}(T)) = \text{nullity}(A)

例11T(x,y,z)=(x+y,y+z)T(x, y, z) = (x + y, y + z) 对应矩阵 A=(110011)A = \begin{pmatrix} 1 & 1 & 0 \\ 0 & 1 & 1 \end{pmatrix}rank(A)=2\text{rank}(A) = 2,像空间是 R2\mathbb{R}^2(满射),核空间是 span{(1,1,1)}\text{span}\{(1, -1, 1)\}(1维),满足 rank(A)+nullity(A)=2+1=3=n\text{rank}(A) + \text{nullity}(A) = 2 + 1 = 3 = n

5. 应用:秩在现实问题中的作用#

5.1 线性方程组:解的存在性与唯一性#

对于线性方程组 Ax=bAx = bAm×n,xRn,bRmA_{m \times n}, x \in \mathbb{R}^n, b \in \mathbb{R}^m):

  • 相容性(有解)rank(A)=rank(Ab)\text{rank}(A) = \text{rank}(A|b)(增广矩阵的秩等于系数矩阵的秩);
  • 解的个数:若相容,解唯一     rank(A)=n\iff \text{rank}(A) = n(无自由变量);无穷多解     rank(A)<n\iff \text{rank}(A) < n(有自由变量)。

例12:方程组 {x+2y=32x+4y=5\begin{cases} x + 2y = 3 \\ 2x + 4y = 5 \end{cases}A=(1224)A = \begin{pmatrix} 1 & 2 \\ 2 & 4 \end{pmatrix}rank(A)=1\text{rank}(A)=1),增广矩阵 (Ab)=(123245)(A|b) = \begin{pmatrix} 1 & 2 & 3 \\ 2 & 4 & 5 \end{pmatrix}rank(Ab)=2\text{rank}(A|b)=2),因 rank(A)rank(Ab)\text{rank}(A) \neq \text{rank}(A|b),故无解。

5.2 线性变换:满射、单射与秩的关系#

对线性变换 T:RnRmT: \mathbb{R}^n \to \mathbb{R}^m(矩阵 AA):

  • 满射(Surjective)Image(T)=Rm    rank(A)=m\text{Image}(T) = \mathbb{R}^m \iff \text{rank}(A) = m(行满秩);
  • 单射(Injective)Kernel(T)={0}    nullity(A)=0    rank(A)=n\text{Kernel}(T) = \{0\} \iff \text{nullity}(A) = 0 \iff \text{rank}(A) = n(列满秩);
  • 同构TT 是同构     m=n\iff m = nrank(A)=n\text{rank}(A) = nAA 可逆)。

5.3 数据科学:主成分分析(PCA)与低秩近似#

现实数据(如高维样本矩阵)往往具有“低秩结构”——大部分信息集中在少数维度。PCA通过寻找数据协方差矩阵的前 kk 个特征向量(对应最大特征值),将数据投影到 kk 维子空间,其中 kk 通常取协方差矩阵的秩(或近似秩)。

:100个20维样本,协方差矩阵秩为5,说明数据本质上是5维的,可用5个主成分保留几乎所有信息,实现降维。

5.4 图像处理:基于低秩的图像压缩#

图像可表示为矩阵(灰度图 m×nm \times n,彩色图 m×n×3m \times n \times 3)。许多图像具有低秩特性(如平滑区域、重复纹理),可通过低秩近似(如截断SVD)用低秩矩阵 A^=Ak\hat{A} = A_kkmin(m,n)k \ll \min(m, n))近似原图像,从而减少存储量(O(k(m+n))O(k(m + n)) 替代 O(mn)O(mn))。

:一张 1000×10001000 \times 1000 的图像,秩为100,用SVD近似后仅需存储 100×(1000+1000)=200,000100 \times (1000 + 1000) = 200,000 个元素,压缩比约5:1。

5.5 机器学习:矩阵分解与协同过滤#

在推荐系统中,用户-物品评分矩阵 Rm×nR_{m \times n} 通常是低秩的(用户偏好和物品属性可由少数潜在因子解释)。通过矩阵分解 RUVTR \approx UV^TUm×k,Vn×k,kmin(m,n)U_{m \times k}, V_{n \times k}, k \ll \min(m, n)),可预测缺失评分,实现协同过滤推荐。

6. 示例解析:从理论到实践#

6.1 基础示例:2x2、3x3矩阵的秩计算#

例13:求 A=(0000)A = \begin{pmatrix} 0 & 0 \\ 0 & 0 \end{pmatrix}B=(1236)B = \begin{pmatrix} 1 & 2 \\ 3 & 6 \end{pmatrix}C=(123456789)C = \begin{pmatrix} 1 & 2 & 3 \\ 4 & 5 & 6 \\ 7 & 8 & 9 \end{pmatrix} 的秩。

  • AA 为零矩阵,rank(A)=0\text{rank}(A) = 0
  • BB 的2阶子式 det(B)=1×62×3=0\det(B) = 1 \times 6 - 2 \times 3 = 0,1阶子式非零,rank(B)=1\text{rank}(B) = 1
  • CC 的3阶子式 det(C)=0\det(C) = 0(行向量线性相关:r3=2r2r1r_3 = 2r_2 - r_1),2阶子式 1245=30\begin{vmatrix} 1 & 2 \\ 4 & 5 \end{vmatrix} = -3 \neq 0,故 rank(C)=2\text{rank}(C) = 2

6.2 进阶示例:应用秩的性质解题#

例14:设 AAnn 阶方阵,证明 rank(A)+rank(InA)n\text{rank}(A) + \text{rank}(I_n - A) \geq n
证明:由 Frobenius 不等式,取 B=InB = I_nC=InAC = I_n - A,则 rank(A(In)(InA))rank(A(In))+rank((In)(InA))rank(In)\text{rank}(A(I_n)(I_n - A)) \geq \text{rank}(A(I_n)) + \text{rank}((I_n)(I_n - A)) - \text{rank}(I_n),即 rank(AA2)rank(A)+rank(InA)n\text{rank}(A - A^2) \geq \text{rank}(A) + \text{rank}(I_n - A) - n。又 rank(AA2)0\text{rank}(A - A^2) \geq 0,故 rank(A)+rank(InA)n\text{rank}(A) + \text{rank}(I_n - A) \geq n

6.3 综合示例:线性方程组与秩的关系#

例15:讨论方程组 {x+y+z=a2x+y+3z=bx+2y=c\begin{cases} x + y + z = a \\ 2x + y + 3z = b \\ x + 2y = c \end{cases} 的解的情况。
:系数矩阵 A=(111213120)A = \begin{pmatrix} 1 & 1 & 1 \\ 2 & 1 & 3 \\ 1 & 2 & 0 \end{pmatrix},增广矩阵 (Ab)=(111a213b120c)(A|b) = \begin{pmatrix} 1 & 1 & 1 & a \\ 2 & 1 & 3 & b \\ 1 & 2 & 0 & c \end{pmatrix}
计算 det(A)=1×(1×03×2)1×(2×03×1)+1×(2×21×1)=6+3+3=0\det(A) = 1 \times (1 \times 0 - 3 \times 2) - 1 \times (2 \times 0 - 3 \times 1) + 1 \times (2 \times 2 - 1 \times 1) = -6 + 3 + 3 = 0,故 rank(A)2\text{rank}(A) \leq 2
(Ab)(A|b) 作行变换:r22r1,r3r1r_2 - 2r_1, r_3 - r_1(111a011b2a011ca)r3+r2(111a011b2a000(b2a)+(ca))=(111a011b2a000b+c3a)\begin{pmatrix} 1 & 1 & 1 & a \\ 0 & -1 & 1 & b - 2a \\ 0 & 1 & -1 & c - a \end{pmatrix} \xrightarrow{r_3 + r_2} \begin{pmatrix} 1 & 1 & 1 & a \\ 0 & -1 & 1 & b - 2a \\ 0 & 0 & 0 & (b - 2a) + (c - a) \end{pmatrix} = \begin{pmatrix} 1 & 1 & 1 & a \\ 0 & -1 & 1 & b - 2a \\ 0 & 0 & 0 & b + c - 3a \end{pmatrix}

  • b+c3a0b + c - 3a \neq 0rank(A)=2<rank(Ab)=3\text{rank}(A) = 2 < \text{rank}(A|b) = 3,无解;
  • b+c3a=0b + c - 3a = 0rank(A)=rank(Ab)=2<3\text{rank}(A) = \text{rank}(A|b) = 2 < 3,无穷多解。

7. 常见误区与澄清#

7.1 误区1:秩是“非零元素的个数”?#

反例A=(1111)A = \begin{pmatrix} 1 & 1 \\ 1 & 1 \end{pmatrix} 有4个非零元素,但 rank(A)=1\text{rank}(A) = 1B=(100000001)B = \begin{pmatrix} 1 & 0 & 0 \\ 0 & 0 & 0 \\ 0 & 0 & 1 \end{pmatrix} 有2个非零元素,rank(B)=2\text{rank}(B) = 2
澄清:秩与非零元素个数无关,取决于线性无关的行(列)向量个数。

7.2 误区2:只有方阵才有秩?#

澄清:秩对任意 m×nm \times n 矩阵均有定义,例如 3×43 \times 4 矩阵的秩可在1到3之间取值。

7.3 误区3:秩与行列式“绑定”?#

反例:非方阵无行列式,但有秩;方阵的行列式为零仅说明秩小于阶数,但无法确定具体值(如2阶方阵 det(A)=0\det(A)=0 可能秩1或0)。
澄清:行列式仅能判断方阵是否满秩,秩的定义更广泛(子式的最高阶数)。

7.4 误区4:行阶梯形中“非零行”一定是行秩?#

澄清:行阶梯形的非零行一定线性无关(因主元位置严格递增),故其个数等于行秩,即矩阵的秩。这是行阶梯形法求秩的理论依据。

8. 进阶话题(选读)#

8.1 低秩近似与奇异值分解(SVD)#

任意矩阵 AA 可分解为 A=UΣVTA = U\Sigma V^T,其中 U,VU, V 为正交矩阵,Σ=diag(σ1,σ2,...,σr,0,...,0)\Sigma = \text{diag}(\sigma_1, \sigma_2, ..., \sigma_r, 0, ..., 0)σ1σ2...σr>0\sigma_1 \geq \sigma_2 \geq ... \geq \sigma_r > 0 为奇异值)。取前 kk 个奇异值,得低秩近似 Ak=UkΣkVkTA_k = U_k \Sigma_k V_k^T,它是在 Frobenius 范数下最接近 AA 的秩 kk 矩阵。

8.2 无限维空间中的秩#

在无限维线性空间中,算子的“秩”可推广为“有限秩算子”(像空间有限维),但一般不再有“秩”的定义(因无限维空间的基无法用“个数”衡量)。

8.3 张量的秩#

张量是矩阵的高维推广(如3阶张量 Ai,j,kA_{i,j,k}),其秩定义为“最小分解项数”:A=p=1rupvpwpA = \sum_{p=1}^r u_p \otimes v_p \otimes w_p(外积和),rr 称为张量的秩。张量秩比矩阵秩复杂,例如,并非所有2x2x2张量都能分解为2项(矩阵秩为2时可分解为2项)。

9. 总结#

矩阵的秩是线性代数的核心概念,它通过刻画矩阵行(列)向量的线性无关程度,揭示了矩阵的本质结构。从定义上,秩可以通过行阶梯形、子式或行(列)空间维度来描述;从性质上,它满足转置不变性、乘积秩不等式等一系列“行为准则”;从几何上,秩对应行(列)空间的维度,决定了线性变换的像空间大小;从应用上,秩在求解线性方程组、数据降维、图像压缩等领域发挥着关键作用。

理解秩不仅需要掌握计算方法,更要把握其背后的代数与几何意义。无论是理论研究还是实际问题,秩都是连接线性代数与应用科学的重要桥梁。

10. 参考文献#

  1. 同济大学数学系. (2021). 线性代数(第七版). 高等教育出版社.
  2. Strang, G. (2009). Linear Algebra and Its Applications (4th ed.). Brooks Cole.
  3. Lay, D. C. (2015). Linear Algebra and Its Applications (5th ed.). Pearson.
  4. 李航. (2012). 统计学习方法. 清华大学出版社.(矩阵分解与推荐系统部分)
  5. Golub, G. H., & Van Loan, C. F. (2013). Matrix Computations (4th ed.). Johns Hopkins University Press.(SVD与低秩近似部分)
  6. Khan Academy. "Rank of a Matrix" [在线课程]. https://www.khanacademy.org/math/linear-algebra/matrix-transformations/matrix-rank/v/rank-of-a-matrix

希望这篇文章能帮助你全面理解矩阵的秩!无论是学习线性代数的基础概念,还是探索其在各领域的应用,秩都是一个值得深入研究的核心工具。