定义:秩的多重面孔
1.1 行秩与列秩
1.2 行阶梯形矩阵与秩
1.3 子式与秩的代数定义
1.4 秩的等价性:为何行秩=列秩?
1.5 特殊矩阵的秩(零矩阵、单位矩阵等)
性质:秩的“行为准则”
2.1 基本性质(非负性、有界性等)
2.2 转置不变性:rank ( A ) = rank ( A T ) \text{rank}(A) = \text{rank}(A^T) rank ( A ) = rank ( A T )
2.3 数乘与秩:rank ( k A ) = rank ( A ) \text{rank}(kA) = \text{rank}(A) rank ( k A ) = rank ( A ) (k ≠ 0 k \neq 0 k = 0 )
2.4 和与差的秩:rank ( A ± B ) ≤ rank ( A ) + rank ( B ) \text{rank}(A \pm B) \leq \text{rank}(A) + \text{rank}(B) rank ( A ± B ) ≤ rank ( A ) + rank ( B )
2.5 乘积的秩:rank ( A B ) ≤ min ( rank ( A ) , rank ( B ) ) \text{rank}(AB) \leq \min(\text{rank}(A), \text{rank}(B)) rank ( A B ) ≤ min ( rank ( A ) , rank ( B ))
2.6 Sylvester不等式与Frobenius不等式
2.7 秩-零度定理(Rank-Nullity Theorem)
计算方法:如何求矩阵的秩?
3.1 行阶梯形法(高斯消元法):步骤与示例
3.2 子式法:从高阶到低阶的搜索
3.3 行列式法(仅适用于方阵)
3.4 工具辅助:Python与MATLAB中的秩计算
几何意义:秩如何“塑造”空间?
4.1 行空间与列空间的维度
4.2 秩与线性相关性:基与张成空间
4.3 低维示例:秩1、秩2的几何直观
4.4 线性变换视角:秩与像空间的维度
应用:秩在现实问题中的作用
5.1 线性方程组:解的存在性与唯一性
5.2 线性变换:满射、单射与秩的关系
5.3 数据科学:主成分分析(PCA)与低秩近似
5.4 图像处理:基于低秩的图像压缩
5.5 机器学习:矩阵分解与协同过滤
示例解析:从理论到实践
6.1 基础示例:2x2、3x3矩阵的秩计算
6.2 进阶示例:应用秩的性质解题
6.3 综合示例:线性方程组与秩的关系
常见误区与澄清
7.1 误区1:秩是“非零元素的个数”?
7.2 误区2:只有方阵才有秩?
7.3 误区3:秩与行列式“绑定”?
7.4 误区4:行阶梯形中“非零行”一定是行秩?
进阶话题(选读)
8.1 低秩近似与奇异值分解(SVD)
8.2 无限维空间中的秩
8.3 张量的秩:从矩阵到高维数组
总结
参考文献
1. 定义:秩的多重面孔#
1.1 行秩与列秩#
矩阵的秩起源于对“独立信息”的刻画。直观地说,秩反映了矩阵中行(或列)向量所包含的“有效维度”。我们从两个基本概念入手:
行秩(Row Rank) :矩阵的行向量组的秩,即行向量组中线性无关向量的最大个数。
列秩(Column Rank) :矩阵的列向量组的秩,即列向量组中线性无关向量的最大个数。
例1 :考虑矩阵 A = ( 1 2 3 2 4 6 ) A = \begin{pmatrix} 1 & 2 & 3 \\ 2 & 4 & 6 \end{pmatrix} A = ( 1 2 2 4 3 6 ) 。
行向量组为 α 1 = ( 1 , 2 , 3 ) \alpha_1 = (1, 2, 3) α 1 = ( 1 , 2 , 3 ) ,α 2 = ( 2 , 4 , 6 ) \alpha_2 = (2, 4, 6) α 2 = ( 2 , 4 , 6 ) 。由于 α 2 = 2 α 1 \alpha_2 = 2\alpha_1 α 2 = 2 α 1 ,行向量组线性相关,故行秩为1。
列向量组为 β 1 = ( 1 , 2 ) T \beta_1 = (1, 2)^T β 1 = ( 1 , 2 ) T ,β 2 = ( 2 , 4 ) T \beta_2 = (2, 4)^T β 2 = ( 2 , 4 ) T ,β 3 = ( 3 , 6 ) T \beta_3 = (3, 6)^T β 3 = ( 3 , 6 ) T 。同理,β 2 = 2 β 1 \beta_2 = 2\beta_1 β 2 = 2 β 1 ,β 3 = 3 β 1 \beta_3 = 3\beta_1 β 3 = 3 β 1 ,列向量组线性相关,列秩也为1。
1.2 行阶梯形矩阵与秩#
行阶梯形矩阵(Row Echelon Form, REF) 是一种特殊的矩阵形式,其满足:
非零行(至少有一个非零元素的行)均位于零行(全零元素的行)上方;
对于非零行,从左起第一个非零元素(称为“主元”或“ pivot”)的列标,严格大于上一行主元的列标。
定义 :矩阵的秩等于其行阶梯形矩阵中非零行的个数。
例2 :将例1中的矩阵 A A A 化为行阶梯形:
A = ( 1 2 3 2 4 6 ) → r 2 − 2 r 1 ( 1 2 3 0 0 0 ) A = \begin{pmatrix} 1 & 2 & 3 \\ 2 & 4 & 6 \end{pmatrix} \xrightarrow{r_2 - 2r_1} \begin{pmatrix} 1 & 2 & 3 \\ 0 & 0 & 0 \end{pmatrix} A = ( 1 2 2 4 3 6 ) r 2 − 2 r 1 ( 1 0 2 0 3 0 ) (行阶梯形),非零行个数为1,故 rank ( A ) = 1 \text{rank}(A) = 1 rank ( A ) = 1 。
1.3 子式与秩的代数定义#
子式(Minor) :对于 m × n m \times n m × n 矩阵 A A A ,任取 k k k 行 k k k 列(1 ≤ k ≤ min ( m , n ) 1 \leq k \leq \min(m, n) 1 ≤ k ≤ min ( m , n ) ),交叉处元素构成的 k k k 阶行列式称为 A A A 的 k k k 阶子式。
定义 :矩阵 A A A 的秩是其非零子式的最高阶数,记为 rank ( A ) \text{rank}(A) rank ( A ) 或 r ( A ) r(A) r ( A ) 。
例3 :矩阵 A = ( 1 2 3 4 ) A = \begin{pmatrix} 1 & 2 \\ 3 & 4 \end{pmatrix} A = ( 1 3 2 4 ) 的2阶子式为 det ( A ) = 1 × 4 − 2 × 3 = − 2 ≠ 0 \det(A) = 1 \times 4 - 2 \times 3 = -2 \neq 0 det ( A ) = 1 × 4 − 2 × 3 = − 2 = 0 ,故 rank ( A ) = 2 \text{rank}(A) = 2 rank ( A ) = 2 。
1.4 秩的等价性:为何行秩=列秩?#
一个深刻的结论是:任何矩阵的行秩等于列秩 。因此,我们可以统一称为“矩阵的秩”。
直观解释 :行阶梯形矩阵的行秩等于非零行个数,而列秩等于主元列个数(含主元的列)。由于主元列是线性无关的,且其他列可由主元列线性表示,故列秩也等于非零行个数,即行秩=列秩。
代数证明 (子式角度):若 A A A 的行秩为 r r r ,则存在 r r r 个线性无关行向量,它们张成的子矩阵的列秩也为 r r r (因行秩=列秩对该子矩阵成立),故 A A A 的列秩至少为 r r r ;同理可证行秩至少等于列秩,因此两者相等。
1.5 特殊矩阵的秩#
零矩阵 :所有元素均为0的矩阵,其所有子式均为0,故 rank ( O ) = 0 \text{rank}(O) = 0 rank ( O ) = 0 。
单位矩阵 :n n n 阶单位矩阵 I n I_n I n 的 n n n 阶子式 det ( I n ) = 1 ≠ 0 \det(I_n) = 1 \neq 0 det ( I n ) = 1 = 0 ,故 rank ( I n ) = n \text{rank}(I_n) = n rank ( I n ) = n (满秩)。
秩1矩阵 :可表示为 A = u v T A = uv^T A = u v T (u , v u, v u , v 为非零向量),其所有2阶子式均为0,且1阶子式非零,故 rank ( A ) = 1 \text{rank}(A) = 1 rank ( A ) = 1 。
2. 性质:秩的“行为准则”#
2.1 基本性质#
非负性 :rank ( A ) ≥ 0 \text{rank}(A) \geq 0 rank ( A ) ≥ 0 ,且 rank ( A ) = 0 ⟺ A = O \text{rank}(A) = 0 \iff A = O rank ( A ) = 0 ⟺ A = O 。
有界性 :对 m × n m \times n m × n 矩阵 A A A ,0 ≤ rank ( A ) ≤ min ( m , n ) 0 \leq \text{rank}(A) \leq \min(m, n) 0 ≤ rank ( A ) ≤ min ( m , n ) 。若 rank ( A ) = min ( m , n ) \text{rank}(A) = \min(m, n) rank ( A ) = min ( m , n ) ,称 A A A 为满秩矩阵 。
证明 :A A A 的 k k k 阶子式与 A T A^T A T 的 k k k 阶子式互为转置行列式,而行列式转置后值不变。因此,A A A 与 A T A^T A T 的非零子式最高阶数相同,即秩相等。
证明 :k A kA k A 的 k k k 阶子式为 k r k^r k r 乘以 A A A 的 k k k 阶子式(r r r 为子式阶数)。由于 k ≠ 0 k \neq 0 k = 0 ,k A kA k A 与 A A A 的非零子式最高阶数相同,故秩不变。
直观解释 :A ± B A \pm B A ± B 的行向量可由 A A A 和 B B B 的行向量线性表示,故其行秩不超过 A A A 与 B B B 的行秩之和。
例4 :设 A = ( 1 0 0 0 ) A = \begin{pmatrix} 1 & 0 \\ 0 & 0 \end{pmatrix} A = ( 1 0 0 0 ) ,B = ( 0 0 0 1 ) B = \begin{pmatrix} 0 & 0 \\ 0 & 1 \end{pmatrix} B = ( 0 0 0 1 ) ,则 rank ( A ) = rank ( B ) = 1 \text{rank}(A) = \text{rank}(B) = 1 rank ( A ) = rank ( B ) = 1 ,rank ( A + B ) = 2 = 1 + 1 \text{rank}(A+B) = 2 = 1+1 rank ( A + B ) = 2 = 1 + 1 ,取等号;若 B = A B = A B = A ,则 rank ( A + B ) = rank ( 2 A ) = 1 < 1 + 1 \text{rank}(A+B) = \text{rank}(2A) = 1 < 1+1 rank ( A + B ) = rank ( 2 A ) = 1 < 1 + 1 ,取不等号。
几何解释 :矩阵乘法 A B AB A B 可视为先进行 B B B 对应的线性变换,再进行 A A A 对应的变换。像空间的维度不会超过前一个变换的像空间维度(rank ( B ) \text{rank}(B) rank ( B ) ),也不会超过 A A A 的像空间维度(rank ( A ) \text{rank}(A) rank ( A ) )。
例5 :A = ( 1 0 0 0 ) A = \begin{pmatrix} 1 & 0 \\ 0 & 0 \end{pmatrix} A = ( 1 0 0 0 ) (rank ( A ) = 1 \text{rank}(A)=1 rank ( A ) = 1 ),B = ( 0 1 0 0 ) B = \begin{pmatrix} 0 & 1 \\ 0 & 0 \end{pmatrix} B = ( 0 0 1 0 ) (rank ( B ) = 1 \text{rank}(B)=1 rank ( B ) = 1 ),则 A B = ( 0 1 0 0 ) AB = \begin{pmatrix} 0 & 1 \\ 0 & 0 \end{pmatrix} A B = ( 0 0 1 0 ) (rank ( A B ) = 1 ≤ min ( 1 , 1 ) \text{rank}(AB)=1 \leq \min(1,1) rank ( A B ) = 1 ≤ min ( 1 , 1 ) );B A = O BA = O B A = O (rank ( B A ) = 0 ≤ 1 \text{rank}(BA)=0 \leq 1 rank ( B A ) = 0 ≤ 1 )。
2.6 Sylvester不等式与Frobenius不等式#
Sylvester不等式 :对 m × n m \times n m × n 矩阵 A A A 和 n × p n \times p n × p 矩阵 B B B ,有
rank ( A ) + rank ( B ) − n ≤ rank ( A B ) \text{rank}(A) + \text{rank}(B) - n \leq \text{rank}(AB) rank ( A ) + rank ( B ) − n ≤ rank ( A B ) 。
等号条件 :当 A A A 和 B B B 分别为列满秩和行满秩时,rank ( A B ) = rank ( A ) = rank ( B ) \text{rank}(AB) = \text{rank}(A) = \text{rank}(B) rank ( A B ) = rank ( A ) = rank ( B ) 。
Frobenius不等式 :对 A , B , C A, B, C A , B , C 可乘矩阵,有
rank ( A B C ) ≥ rank ( A B ) + rank ( B C ) − rank ( B ) \text{rank}(ABC) \geq \text{rank}(AB) + \text{rank}(BC) - \text{rank}(B) rank ( A BC ) ≥ rank ( A B ) + rank ( BC ) − rank ( B ) 。
2.7 秩-零度定理(Rank-Nullity Theorem)#
零度(Nullity) :矩阵 A A A 的零空间(解空间 A x = 0 Ax = 0 A x = 0 )的维度,记为 nullity ( A ) \text{nullity}(A) nullity ( A ) 。
定理 :对 m × n m \times n m × n 矩阵 A A A ,有
rank ( A ) + nullity ( A ) = n \text{rank}(A) + \text{nullity}(A) = n rank ( A ) + nullity ( A ) = n 。
意义 :列数(变量数)= 秩(独立方程数)+ 零度(自由变量数)。这是线性代数中连接代数与几何的核心定理。
例6 :A = ( 1 2 3 2 4 6 ) A = \begin{pmatrix} 1 & 2 & 3 \\ 2 & 4 & 6 \end{pmatrix} A = ( 1 2 2 4 3 6 ) (rank ( A ) = 1 \text{rank}(A)=1 rank ( A ) = 1 ,n = 3 n=3 n = 3 ),则 nullity ( A ) = 3 − 1 = 2 \text{nullity}(A) = 3 - 1 = 2 nullity ( A ) = 3 − 1 = 2 ,即 A x = 0 Ax=0 A x = 0 的解空间是2维的(平面)。
3. 计算方法:如何求矩阵的秩?#
3.1 行阶梯形法(高斯消元法):步骤与示例#
核心思想 :通过初等行变换将矩阵化为行阶梯形,非零行个数即为秩。
初等行变换 :
换行:交换两行(不改变秩);
倍乘:某行乘以非零常数(不改变秩);
倍加:某行加上另一行的倍数(不改变秩)。
步骤 :
从左到右、从上到下寻找主元列(首个非零列);
选非零行作为首行,将主元下方元素消为0;
对剩余子矩阵重复上述步骤,直至化为行阶梯形。
例7 :求 A = ( 1 2 3 4 2 4 6 8 3 5 7 9 ) A = \begin{pmatrix} 1 & 2 & 3 & 4 \\ 2 & 4 & 6 & 8 \\ 3 & 5 & 7 & 9 \end{pmatrix} A = 1 2 3 2 4 5 3 6 7 4 8 9 的秩。
解 :
A → r 2 − 2 r 1 ( 1 2 3 4 0 0 0 0 3 5 7 9 ) → r 3 − 3 r 1 ( 1 2 3 4 0 0 0 0 0 − 1 − 2 − 3 ) → r 2 ↔ r 3 ( 1 2 3 4 0 − 1 − 2 − 3 0 0 0 0 ) A \xrightarrow{r_2 - 2r_1} \begin{pmatrix} 1 & 2 & 3 & 4 \\ 0 & 0 & 0 & 0 \\ 3 & 5 & 7 & 9 \end{pmatrix} \xrightarrow{r_3 - 3r_1} \begin{pmatrix} 1 & 2 & 3 & 4 \\ 0 & 0 & 0 & 0 \\ 0 & -1 & -2 & -3 \end{pmatrix} \xrightarrow{r_2 \leftrightarrow r_3} \begin{pmatrix} 1 & 2 & 3 & 4 \\ 0 & -1 & -2 & -3 \\ 0 & 0 & 0 & 0 \end{pmatrix} A r 2 − 2 r 1 1 0 3 2 0 5 3 0 7 4 0 9 r 3 − 3 r 1 1 0 0 2 0 − 1 3 0 − 2 4 0 − 3 r 2 ↔ r 3 1 0 0 2 − 1 0 3 − 2 0 4 − 3 0 (行阶梯形),非零行个数为2,故 rank ( A ) = 2 \text{rank}(A) = 2 rank ( A ) = 2 。
3.2 子式法:从高阶到低阶的搜索#
步骤 :
计算 min ( m , n ) \min(m, n) min ( m , n ) 阶子式,若存在非零,秩为 min ( m , n ) \min(m, n) min ( m , n ) ;
否则,计算 min ( m , n ) − 1 \min(m, n)-1 min ( m , n ) − 1 阶子式,若存在非零,秩为 min ( m , n ) − 1 \min(m, n)-1 min ( m , n ) − 1 ;
重复直至找到非零子式或确定秩为0。
例8 :求 A = ( 1 1 2 2 2 4 3 3 5 ) A = \begin{pmatrix} 1 & 1 & 2 \\ 2 & 2 & 4 \\ 3 & 3 & 5 \end{pmatrix} A = 1 2 3 1 2 3 2 4 5 的秩。
解 :3阶子式 det ( A ) = 0 \det(A) = 0 det ( A ) = 0 (前两列成比例);2阶子式 ∣ 1 2 3 5 ∣ = 5 − 6 = − 1 ≠ 0 \begin{vmatrix} 1 & 2 \\ 3 & 5 \end{vmatrix} = 5 - 6 = -1 \neq 0 1 3 2 5 = 5 − 6 = − 1 = 0 ,故 rank ( A ) = 2 \text{rank}(A) = 2 rank ( A ) = 2 。
3.3 行列式法(仅适用于方阵)#
对于 n n n 阶方阵 A A A :
若 det ( A ) ≠ 0 \det(A) \neq 0 det ( A ) = 0 (非奇异),则 rank ( A ) = n \text{rank}(A) = n rank ( A ) = n ;
若 det ( A ) = 0 \det(A) = 0 det ( A ) = 0 (奇异),则 rank ( A ) < n \text{rank}(A) < n rank ( A ) < n ,需进一步判断低阶子式。
3.4 工具辅助:Python与MATLAB中的秩计算#
Python(NumPy) :
import numpy as np
A = np.array([[ 1 , 2 , 3 ], [ 2 , 4 , 6 ], [ 3 , 5 , 7 ]])
print (np.linalg.matrix_rank(A)) # 输出:2
MATLAB :
A = [ 1 2 3 ; 2 4 6 ; 3 5 7 ];
rank(A) % 输出:2
4. 几何意义:秩如何“塑造”空间?#
4.1 行空间与列空间的维度#
行空间(Row Space) :矩阵 A A A 的行向量张成的向量空间,记为 Row ( A ) \text{Row}(A) Row ( A ) ,其维度 dim ( Row ( A ) ) = rank ( A ) \dim(\text{Row}(A)) = \text{rank}(A) dim ( Row ( A )) = rank ( A ) 。
列空间(Column Space) :矩阵 A A A 的列向量张成的向量空间,记为 Col ( A ) \text{Col}(A) Col ( A ) ,其维度 dim ( Col ( A ) ) = rank ( A ) \dim(\text{Col}(A)) = \text{rank}(A) dim ( Col ( A )) = rank ( A ) 。
例9 :A = ( 1 2 3 4 ) A = \begin{pmatrix} 1 & 2 \\ 3 & 4 \end{pmatrix} A = ( 1 3 2 4 ) 的行空间是 R 2 \mathbb{R}^2 R 2 (因行向量线性无关),列空间也是 R 2 \mathbb{R}^2 R 2 ,故 dim ( Row ( A ) ) = dim ( Col ( A ) ) = 2 = rank ( A ) \dim(\text{Row}(A)) = \dim(\text{Col}(A)) = 2 = \text{rank}(A) dim ( Row ( A )) = dim ( Col ( A )) = 2 = rank ( A ) 。
4.2 秩与线性相关性:基与张成空间#
矩阵的秩本质上是其行(列)向量组的极大线性无关组的大小。极大无关组构成行(列)空间的一组基,而其他向量可由基线性表示。
例10 :矩阵 A = ( 1 0 1 0 1 1 1 1 2 ) A = \begin{pmatrix} 1 & 0 & 1 \\ 0 & 1 & 1 \\ 1 & 1 & 2 \end{pmatrix} A = 1 0 1 0 1 1 1 1 2 的行向量组为 α 1 = ( 1 , 0 , 1 ) , α 2 = ( 0 , 1 , 1 ) , α 3 = ( 1 , 1 , 2 ) \alpha_1=(1,0,1), \alpha_2=(0,1,1), \alpha_3=(1,1,2) α 1 = ( 1 , 0 , 1 ) , α 2 = ( 0 , 1 , 1 ) , α 3 = ( 1 , 1 , 2 ) 。由于 α 3 = α 1 + α 2 \alpha_3 = \alpha_1 + \alpha_2 α 3 = α 1 + α 2 ,极大无关组为 { α 1 , α 2 } \{\alpha_1, \alpha_2\} { α 1 , α 2 } ,故 rank ( A ) = 2 \text{rank}(A) = 2 rank ( A ) = 2 ,行空间是由 α 1 , α 2 \alpha_1, \alpha_2 α 1 , α 2 张成的平面(2维子空间)。
4.3 低维示例:秩1、秩2的几何直观#
秩1矩阵 :行空间与列空间均为1维(直线)。例如,A = ( 1 2 3 2 4 6 ) A = \begin{pmatrix} 1 & 2 & 3 \\ 2 & 4 & 6 \end{pmatrix} A = ( 1 2 2 4 3 6 ) 的行空间是 span { ( 1 , 2 , 3 ) } \text{span}\{(1,2,3)\} span {( 1 , 2 , 3 )} (一条直线),列空间是 span { ( 1 , 2 ) } \text{span}\{(1,2)\} span {( 1 , 2 )} (另一条直线)。
秩2矩阵(3x3) :行空间/列空间是 R 3 \mathbb{R}^3 R 3 中的平面。例如,A = ( 1 0 0 0 1 0 1 1 0 ) A = \begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 1 & 1 & 0 \end{pmatrix} A = 1 0 1 0 1 1 0 0 0 的列空间是 x y xy x y 平面(span { ( 1 , 0 , 1 ) , ( 0 , 1 , 1 ) } \text{span}\{(1,0,1), (0,1,1)\} span {( 1 , 0 , 1 ) , ( 0 , 1 , 1 )} ),秩为2。
4.4 线性变换视角:秩与像空间的维度#
矩阵 A m × n A_{m \times n} A m × n 可表示从 R n \mathbb{R}^n R n 到 R m \mathbb{R}^m R m 的线性变换 T ( x ) = A x T(x) = Ax T ( x ) = A x 。此时:
像空间(Image Space) :T T T 的像空间即 A A A 的列空间,dim ( Image ( T ) ) = rank ( A ) \dim(\text{Image}(T)) = \text{rank}(A) dim ( Image ( T )) = rank ( A ) ;
核空间(Kernel Space) :T T T 的核空间即 A A A 的零空间,dim ( Kernel ( T ) ) = nullity ( A ) \dim(\text{Kernel}(T)) = \text{nullity}(A) dim ( Kernel ( T )) = nullity ( A ) 。
例11 :T ( x , y , z ) = ( x + y , y + z ) T(x, y, z) = (x + y, y + z) T ( x , y , z ) = ( x + y , y + z ) 对应矩阵 A = ( 1 1 0 0 1 1 ) A = \begin{pmatrix} 1 & 1 & 0 \\ 0 & 1 & 1 \end{pmatrix} A = ( 1 0 1 1 0 1 ) ,rank ( A ) = 2 \text{rank}(A) = 2 rank ( A ) = 2 ,像空间是 R 2 \mathbb{R}^2 R 2 (满射),核空间是 span { ( 1 , − 1 , 1 ) } \text{span}\{(1, -1, 1)\} span {( 1 , − 1 , 1 )} (1维),满足 rank ( A ) + nullity ( A ) = 2 + 1 = 3 = n \text{rank}(A) + \text{nullity}(A) = 2 + 1 = 3 = n rank ( A ) + nullity ( A ) = 2 + 1 = 3 = n 。
5. 应用:秩在现实问题中的作用#
5.1 线性方程组:解的存在性与唯一性#
对于线性方程组 A x = b Ax = b A x = b (A m × n , x ∈ R n , b ∈ R m A_{m \times n}, x \in \mathbb{R}^n, b \in \mathbb{R}^m A m × n , x ∈ R n , b ∈ R m ):
相容性(有解) :rank ( A ) = rank ( A ∣ b ) \text{rank}(A) = \text{rank}(A|b) rank ( A ) = rank ( A ∣ b ) (增广矩阵的秩等于系数矩阵的秩);
解的个数 :若相容,解唯一 ⟺ rank ( A ) = n \iff \text{rank}(A) = n ⟺ rank ( A ) = n (无自由变量);无穷多解 ⟺ rank ( A ) < n \iff \text{rank}(A) < n ⟺ rank ( A ) < n (有自由变量)。
例12 :方程组 { x + 2 y = 3 2 x + 4 y = 5 \begin{cases} x + 2y = 3 \\ 2x + 4y = 5 \end{cases} { x + 2 y = 3 2 x + 4 y = 5 ,A = ( 1 2 2 4 ) A = \begin{pmatrix} 1 & 2 \\ 2 & 4 \end{pmatrix} A = ( 1 2 2 4 ) (rank ( A ) = 1 \text{rank}(A)=1 rank ( A ) = 1 ),增广矩阵 ( A ∣ b ) = ( 1 2 3 2 4 5 ) (A|b) = \begin{pmatrix} 1 & 2 & 3 \\ 2 & 4 & 5 \end{pmatrix} ( A ∣ b ) = ( 1 2 2 4 3 5 ) (rank ( A ∣ b ) = 2 \text{rank}(A|b)=2 rank ( A ∣ b ) = 2 ),因 rank ( A ) ≠ rank ( A ∣ b ) \text{rank}(A) \neq \text{rank}(A|b) rank ( A ) = rank ( A ∣ b ) ,故无解。
5.2 线性变换:满射、单射与秩的关系#
对线性变换 T : R n → R m T: \mathbb{R}^n \to \mathbb{R}^m T : R n → R m (矩阵 A A A ):
满射(Surjective) :Image ( T ) = R m ⟺ rank ( A ) = m \text{Image}(T) = \mathbb{R}^m \iff \text{rank}(A) = m Image ( T ) = R m ⟺ rank ( A ) = m (行满秩);
单射(Injective) :Kernel ( T ) = { 0 } ⟺ nullity ( A ) = 0 ⟺ rank ( A ) = n \text{Kernel}(T) = \{0\} \iff \text{nullity}(A) = 0 \iff \text{rank}(A) = n Kernel ( T ) = { 0 } ⟺ nullity ( A ) = 0 ⟺ rank ( A ) = n (列满秩);
同构 :T T T 是同构 ⟺ m = n \iff m = n ⟺ m = n 且 rank ( A ) = n \text{rank}(A) = n rank ( A ) = n (A A A 可逆)。
5.3 数据科学:主成分分析(PCA)与低秩近似#
现实数据(如高维样本矩阵)往往具有“低秩结构”——大部分信息集中在少数维度。PCA通过寻找数据协方差矩阵的前 k k k 个特征向量(对应最大特征值),将数据投影到 k k k 维子空间,其中 k k k 通常取协方差矩阵的秩(或近似秩)。
例 :100个20维样本,协方差矩阵秩为5,说明数据本质上是5维的,可用5个主成分保留几乎所有信息,实现降维。
5.4 图像处理:基于低秩的图像压缩#
图像可表示为矩阵(灰度图 m × n m \times n m × n ,彩色图 m × n × 3 m \times n \times 3 m × n × 3 )。许多图像具有低秩特性(如平滑区域、重复纹理),可通过低秩近似(如截断SVD)用低秩矩阵 A ^ = A k \hat{A} = A_k A ^ = A k (k ≪ min ( m , n ) k \ll \min(m, n) k ≪ min ( m , n ) )近似原图像,从而减少存储量(O ( k ( m + n ) ) O(k(m + n)) O ( k ( m + n )) 替代 O ( m n ) O(mn) O ( mn ) )。
例 :一张 1000 × 1000 1000 \times 1000 1000 × 1000 的图像,秩为100,用SVD近似后仅需存储 100 × ( 1000 + 1000 ) = 200 , 000 100 \times (1000 + 1000) = 200,000 100 × ( 1000 + 1000 ) = 200 , 000 个元素,压缩比约5:1。
5.5 机器学习:矩阵分解与协同过滤#
在推荐系统中,用户-物品评分矩阵 R m × n R_{m \times n} R m × n 通常是低秩的(用户偏好和物品属性可由少数潜在因子解释)。通过矩阵分解 R ≈ U V T R \approx UV^T R ≈ U V T (U m × k , V n × k , k ≪ min ( m , n ) U_{m \times k}, V_{n \times k}, k \ll \min(m, n) U m × k , V n × k , k ≪ min ( m , n ) ),可预测缺失评分,实现协同过滤推荐。
6. 示例解析:从理论到实践#
6.1 基础示例:2x2、3x3矩阵的秩计算#
例13 :求 A = ( 0 0 0 0 ) A = \begin{pmatrix} 0 & 0 \\ 0 & 0 \end{pmatrix} A = ( 0 0 0 0 ) ,B = ( 1 2 3 6 ) B = \begin{pmatrix} 1 & 2 \\ 3 & 6 \end{pmatrix} B = ( 1 3 2 6 ) ,C = ( 1 2 3 4 5 6 7 8 9 ) C = \begin{pmatrix} 1 & 2 & 3 \\ 4 & 5 & 6 \\ 7 & 8 & 9 \end{pmatrix} C = 1 4 7 2 5 8 3 6 9 的秩。
解 :
A A A 为零矩阵,rank ( A ) = 0 \text{rank}(A) = 0 rank ( A ) = 0 ;
B B B 的2阶子式 det ( B ) = 1 × 6 − 2 × 3 = 0 \det(B) = 1 \times 6 - 2 \times 3 = 0 det ( B ) = 1 × 6 − 2 × 3 = 0 ,1阶子式非零,rank ( B ) = 1 \text{rank}(B) = 1 rank ( B ) = 1 ;
C C C 的3阶子式 det ( C ) = 0 \det(C) = 0 det ( C ) = 0 (行向量线性相关:r 3 = 2 r 2 − r 1 r_3 = 2r_2 - r_1 r 3 = 2 r 2 − r 1 ),2阶子式 ∣ 1 2 4 5 ∣ = − 3 ≠ 0 \begin{vmatrix} 1 & 2 \\ 4 & 5 \end{vmatrix} = -3 \neq 0 1 4 2 5 = − 3 = 0 ,故 rank ( C ) = 2 \text{rank}(C) = 2 rank ( C ) = 2 。
6.2 进阶示例:应用秩的性质解题#
例14 :设 A A A 为 n n n 阶方阵,证明 rank ( A ) + rank ( I n − A ) ≥ n \text{rank}(A) + \text{rank}(I_n - A) \geq n rank ( A ) + rank ( I n − A ) ≥ n 。
证明 :由 Frobenius 不等式,取 B = I n B = I_n B = I n ,C = I n − A C = I_n - A C = I n − A ,则 rank ( A ( I n ) ( I n − A ) ) ≥ rank ( A ( I n ) ) + rank ( ( I n ) ( I n − A ) ) − rank ( I n ) \text{rank}(A(I_n)(I_n - A)) \geq \text{rank}(A(I_n)) + \text{rank}((I_n)(I_n - A)) - \text{rank}(I_n) rank ( A ( I n ) ( I n − A )) ≥ rank ( A ( I n )) + rank (( I n ) ( I n − A )) − rank ( I n ) ,即 rank ( A − A 2 ) ≥ rank ( A ) + rank ( I n − A ) − n \text{rank}(A - A^2) \geq \text{rank}(A) + \text{rank}(I_n - A) - n rank ( A − A 2 ) ≥ rank ( A ) + rank ( I n − A ) − n 。又 rank ( A − A 2 ) ≥ 0 \text{rank}(A - A^2) \geq 0 rank ( A − A 2 ) ≥ 0 ,故 rank ( A ) + rank ( I n − A ) ≥ n \text{rank}(A) + \text{rank}(I_n - A) \geq n rank ( A ) + rank ( I n − A ) ≥ n 。
6.3 综合示例:线性方程组与秩的关系#
例15 :讨论方程组 { x + y + z = a 2 x + y + 3 z = b x + 2 y = c \begin{cases} x + y + z = a \\ 2x + y + 3z = b \\ x + 2y = c \end{cases} ⎩ ⎨ ⎧ x + y + z = a 2 x + y + 3 z = b x + 2 y = c 的解的情况。
解 :系数矩阵 A = ( 1 1 1 2 1 3 1 2 0 ) A = \begin{pmatrix} 1 & 1 & 1 \\ 2 & 1 & 3 \\ 1 & 2 & 0 \end{pmatrix} A = 1 2 1 1 1 2 1 3 0 ,增广矩阵 ( A ∣ b ) = ( 1 1 1 a 2 1 3 b 1 2 0 c ) (A|b) = \begin{pmatrix} 1 & 1 & 1 & a \\ 2 & 1 & 3 & b \\ 1 & 2 & 0 & c \end{pmatrix} ( A ∣ b ) = 1 2 1 1 1 2 1 3 0 a b c 。
计算 det ( A ) = 1 × ( 1 × 0 − 3 × 2 ) − 1 × ( 2 × 0 − 3 × 1 ) + 1 × ( 2 × 2 − 1 × 1 ) = − 6 + 3 + 3 = 0 \det(A) = 1 \times (1 \times 0 - 3 \times 2) - 1 \times (2 \times 0 - 3 \times 1) + 1 \times (2 \times 2 - 1 \times 1) = -6 + 3 + 3 = 0 det ( A ) = 1 × ( 1 × 0 − 3 × 2 ) − 1 × ( 2 × 0 − 3 × 1 ) + 1 × ( 2 × 2 − 1 × 1 ) = − 6 + 3 + 3 = 0 ,故 rank ( A ) ≤ 2 \text{rank}(A) \leq 2 rank ( A ) ≤ 2 。
对 ( A ∣ b ) (A|b) ( A ∣ b ) 作行变换:r 2 − 2 r 1 , r 3 − r 1 r_2 - 2r_1, r_3 - r_1 r 2 − 2 r 1 , r 3 − r 1 得 ( 1 1 1 a 0 − 1 1 b − 2 a 0 1 − 1 c − a ) → r 3 + r 2 ( 1 1 1 a 0 − 1 1 b − 2 a 0 0 0 ( b − 2 a ) + ( c − a ) ) = ( 1 1 1 a 0 − 1 1 b − 2 a 0 0 0 b + c − 3 a ) \begin{pmatrix} 1 & 1 & 1 & a \\ 0 & -1 & 1 & b - 2a \\ 0 & 1 & -1 & c - a \end{pmatrix} \xrightarrow{r_3 + r_2} \begin{pmatrix} 1 & 1 & 1 & a \\ 0 & -1 & 1 & b - 2a \\ 0 & 0 & 0 & (b - 2a) + (c - a) \end{pmatrix} = \begin{pmatrix} 1 & 1 & 1 & a \\ 0 & -1 & 1 & b - 2a \\ 0 & 0 & 0 & b + c - 3a \end{pmatrix} 1 0 0 1 − 1 1 1 1 − 1 a b − 2 a c − a r 3 + r 2 1 0 0 1 − 1 0 1 1 0 a b − 2 a ( b − 2 a ) + ( c − a ) = 1 0 0 1 − 1 0 1 1 0 a b − 2 a b + c − 3 a 。
若 b + c − 3 a ≠ 0 b + c - 3a \neq 0 b + c − 3 a = 0 ,rank ( A ) = 2 < rank ( A ∣ b ) = 3 \text{rank}(A) = 2 < \text{rank}(A|b) = 3 rank ( A ) = 2 < rank ( A ∣ b ) = 3 ,无解;
若 b + c − 3 a = 0 b + c - 3a = 0 b + c − 3 a = 0 ,rank ( A ) = rank ( A ∣ b ) = 2 < 3 \text{rank}(A) = \text{rank}(A|b) = 2 < 3 rank ( A ) = rank ( A ∣ b ) = 2 < 3 ,无穷多解。
7. 常见误区与澄清#
7.1 误区1:秩是“非零元素的个数”?#
反例 :A = ( 1 1 1 1 ) A = \begin{pmatrix} 1 & 1 \\ 1 & 1 \end{pmatrix} A = ( 1 1 1 1 ) 有4个非零元素,但 rank ( A ) = 1 \text{rank}(A) = 1 rank ( A ) = 1 ;B = ( 1 0 0 0 0 0 0 0 1 ) B = \begin{pmatrix} 1 & 0 & 0 \\ 0 & 0 & 0 \\ 0 & 0 & 1 \end{pmatrix} B = 1 0 0 0 0 0 0 0 1 有2个非零元素,rank ( B ) = 2 \text{rank}(B) = 2 rank ( B ) = 2 。
澄清 :秩与非零元素个数无关,取决于线性无关的行(列)向量个数。
7.2 误区2:只有方阵才有秩?#
澄清 :秩对任意 m × n m \times n m × n 矩阵均有定义,例如 3 × 4 3 \times 4 3 × 4 矩阵的秩可在1到3之间取值。
7.3 误区3:秩与行列式“绑定”?#
反例 :非方阵无行列式,但有秩;方阵的行列式为零仅说明秩小于阶数,但无法确定具体值(如2阶方阵 det ( A ) = 0 \det(A)=0 det ( A ) = 0 可能秩1或0)。
澄清 :行列式仅能判断方阵是否满秩,秩的定义更广泛(子式的最高阶数)。
7.4 误区4:行阶梯形中“非零行”一定是行秩?#
澄清 :行阶梯形的非零行一定线性无关(因主元位置严格递增),故其个数等于行秩,即矩阵的秩。这是行阶梯形法求秩的理论依据。
8. 进阶话题(选读)#
8.1 低秩近似与奇异值分解(SVD)#
任意矩阵 A A A 可分解为 A = U Σ V T A = U\Sigma V^T A = U Σ V T ,其中 U , V U, V U , V 为正交矩阵,Σ = diag ( σ 1 , σ 2 , . . . , σ r , 0 , . . . , 0 ) \Sigma = \text{diag}(\sigma_1, \sigma_2, ..., \sigma_r, 0, ..., 0) Σ = diag ( σ 1 , σ 2 , ... , σ r , 0 , ... , 0 ) (σ 1 ≥ σ 2 ≥ . . . ≥ σ r > 0 \sigma_1 \geq \sigma_2 \geq ... \geq \sigma_r > 0 σ 1 ≥ σ 2 ≥ ... ≥ σ r > 0 为奇异值)。取前 k k k 个奇异值,得低秩近似 A k = U k Σ k V k T A_k = U_k \Sigma_k V_k^T A k = U k Σ k V k T ,它是在 Frobenius 范数下最接近 A A A 的秩 k k k 矩阵。
8.2 无限维空间中的秩#
在无限维线性空间中,算子的“秩”可推广为“有限秩算子”(像空间有限维),但一般不再有“秩”的定义(因无限维空间的基无法用“个数”衡量)。
8.3 张量的秩#
张量是矩阵的高维推广(如3阶张量 A i , j , k A_{i,j,k} A i , j , k ),其秩定义为“最小分解项数”:A = ∑ p = 1 r u p ⊗ v p ⊗ w p A = \sum_{p=1}^r u_p \otimes v_p \otimes w_p A = ∑ p = 1 r u p ⊗ v p ⊗ w p (外积和),r r r 称为张量的秩。张量秩比矩阵秩复杂,例如,并非所有2x2x2张量都能分解为2项(矩阵秩为2时可分解为2项)。
9. 总结#
矩阵的秩是线性代数的核心概念,它通过刻画矩阵行(列)向量的线性无关程度,揭示了矩阵的本质结构。从定义上,秩可以通过行阶梯形、子式或行(列)空间维度来描述;从性质上,它满足转置不变性、乘积秩不等式等一系列“行为准则”;从几何上,秩对应行(列)空间的维度,决定了线性变换的像空间大小;从应用上,秩在求解线性方程组、数据降维、图像压缩等领域发挥着关键作用。
理解秩不仅需要掌握计算方法,更要把握其背后的代数与几何意义。无论是理论研究还是实际问题,秩都是连接线性代数与应用科学的重要桥梁。
10. 参考文献#
同济大学数学系. (2021). 线性代数(第七版) . 高等教育出版社.
Strang, G. (2009). Linear Algebra and Its Applications (4th ed.) . Brooks Cole.
Lay, D. C. (2015). Linear Algebra and Its Applications (5th ed.) . Pearson.
李航. (2012). 统计学习方法 . 清华大学出版社.(矩阵分解与推荐系统部分)
Golub, G. H., & Van Loan, C. F. (2013). Matrix Computations (4th ed.) . Johns Hopkins University Press.(SVD与低秩近似部分)
Khan Academy. "Rank of a Matrix" [在线课程]. https://www.khanacademy.org/math/linear-algebra/matrix-transformations/matrix-rank/v/rank-of-a-matrix
希望这篇文章能帮助你全面理解矩阵的秩!无论是学习线性代数的基础概念,还是探索其在各领域的应用,秩都是一个值得深入研究的核心工具。