从不同的角度看矩阵的行秩与列秩解析.pdf
《从不同的角度看矩阵的行秩与列秩解析.pdf》由会员分享,可在线阅读,更多相关《从不同的角度看矩阵的行秩与列秩解析.pdf(14页珍藏版)》请在三一文库上搜索。
1、http:/ 从不同的角度看矩阵的行秩与列秩兼论如何学好线性代数 线性代数中,有那么几个神秘又神奇的东西,总是让初学它的人琢磨不透,无法理解,其中就有矩阵的行向量 和列向量的关系,为什么一个矩阵的行向量里有多少个线性无关的向量,列向量里就一定也有多少个线性无关 的向量呢?或者考虑稍微简单一点的问题,一个方阵,为什么行向量线性无关或线性相关列向量就一定也线性 无关或相关呢?行秩为何等于列秩? 这本来应该是一个基本又简单的事实。但是,请回忆一下你当初初学线性代数时的内容编排顺序,是怎么引入 这个问题的,当时又是怎样解决这个问题的? 传统的教材编写思路是从线性方程组开始整个线性代数话题的引入,这个过
2、程中定义行列式和矩阵,用n 元数 组引入向量,线性相关和无关等概念,讨论解存在的条件,解的结构,等等。总之,一切以方程组为核心,给 人 的 感 觉 就 是 线 性 代 数 就 是 方 程 组 的 理 论 , 一 切 讨 论 的 目 的 都 是 为 了 解 决 小 小 的 方 程 组 问 题 。 在这个过程中,有一个矩阵行秩等于列秩的命题,此时学生只了解方程组理论和行列式,因此这时对这个问题 的解释当然也无法离开方程组或行列式。下面简述两个典型的教材中的证明方法: 第一个证明来自陈志杰高等代数与解析几何。 证明: 首先,矩阵的初等行变换不改变矩阵的行秩,初等列变换不改变矩阵的列秩。这是由向量组的
3、初等变 换不改变向量组的线性相关或无关性保证的,即将某个向量乘以非零的倍数、将某个向量加到另一个向量上, 都不改变向量组的线性相关或无关性。 接着证明矩阵的初等行变换不改变矩阵的列秩。 设 A 是 m*n 阶矩阵,任意从A 的 n 个列向量中选取k 个列向量 a1,a2, ,ak ,它们线性无关的充要条件是线性 方程组a11+a22+akxk=0 只有零解。而对矩阵A 进行初等行变换不改变此方程组的解,因此不改变这k 个列向量的线性相关或无关性。这说明A 的列向量的秩在矩阵的初等行变换中不变。同理矩阵的初等列变换 不改变矩阵的行秩。 接下来,可以把A 经过初等行变换和初等列变为只有对角线上有1
4、 或 0,其它位置都为0 的矩阵,在这个过程 中行秩和列秩都不改变,从这个矩阵中看出行秩等于列秩,因此原来的矩阵行秩也等于列秩。 第二个证明来自北大数学系几何与代数教研室前代数小组编 高 等代 数 证明:考虑线性方程组AX=0,首先证明如果未知数的个数超过A 的行秩,那么它有非零解。设m*n 阶矩阵 A 的行秩为 r,考虑方程组AX=0,它由 m 个方程 n 个未知数组成。从A 的行向量中选取r 个线性无关的行向量,重新组合成矩阵B, 那么方程组 AX=0 和 BX=0 同解。这时,如果B 的列数大于行数,那么方程组BX=0 必有非零解,从而AX=0 也有非零解。 接着证明行秩等于列秩。设m*
5、n 阶矩阵 A的行秩为 r,列秩为 s。考虑 A 的任意 r+1 个列向量组成的矩阵C,因为 C的行秩 不大于 r(因为 C 的行向量都是A 的行向量的一部分分量组成的),所以CX=0 有非零解,这说明这r+1 个列向量线性相 关。所以 A 的列秩最大为 r,即 s=r。同理可证 r=s,因此 s=r。 有了行秩等于列秩的性质,完全可以用行秩或列秩定义矩阵的秩了。编写教材的人和老师们都认为,只要能够顺利定义出矩 阵的秩,这个证明就足以满足初学时的需要了,既没有必要又没有条件再将它深入地挖掘下去。 但是它仍然让我困惑,即使把书上的这个证明看得明明白白,也不理解为什么行秩等于列秩。因为向量是个几何
6、的概念,现 在这个证明中看不出一点几何上向量的影子,这两个例子都依赖于线性方程组理论,都离不开高斯消元法,都是代数上的推 导。虽然从代数上推导出了这个结果,但是在几何上我依然无法接受这个结果。矩阵的行向量和列向量“ 从图形上 ” 到底是什 么关系?可不可以让我一下子就能看出来它们的秩是相等的?尽管经过了行列变换之后行列秩相等是显然的,但这个过程中 却把原来的行列向量给变得面目全非了。 更有甚者,有些教材上竟然用矩阵的子式和行列式理论推导行秩等于列秩,由于这种证明过于复杂,这里就不列出了。 直 到 最 近 的 一 次 偶 然 机 会 , 又 让 我 想 起 了 这 个 问 题 。 一 开 始 ,
7、 发 现 它 和 对 偶 空 间 与 对 偶 映 射 有 关 系 。 记得当初学习线性代数时,直到最后才接触了一些有关对偶空间和对偶映射的知识,教材还写得十分抽象,以至于我们都囫 囵吞枣地过来了,根本没有什么印象。后来的泛函,因为高等代数理解不深人,对泛函也没有留下什么印象。最近有同事让 我讲线性代数,有很多次问我关于矩阵转置的意义的问题。他曾经学习线性代数时对很多问题不理解,其中就有矩阵转置到 底对应几何上的什么东西,为什么要转置?其实我也没考虑过这个问题,只知道这是代数的特殊需要,当需要把行向量变成 列向量的时候就需要考虑转置,它完全是代数上的处理方式。至于在几何上代表什么意义,我也曾困惑
8、过,但一直没考虑清 楚。然而现在比大一那个时候多了一个学习的更加有效的途径,那就是网络。在wiki 百科中,我查到了一个观点: 在标准正交基底下,如果一个线性映射对应于矩阵A,那么A 的转置恰好对应这个线性映射的转置映射,A 的共轭转置恰 好对应这个线性映射的对偶映射。 在有限维空间中对偶映射还有一个更直观的定义: 设是从到的线性映射,则的对偶映射是从到的满足的线性映射。 这是很好理解的,即使不知道什么是对偶空间及对偶映射,单单从矩阵乘法的性质中也很容易看出A 和 A 的共轭转置之间 的这种关系。 这样就把 A 的共轭转置和A 之间的关系赋予了几何的意义,因为内积正好包含向量的角度信息,并且当
9、一组非零向量两两 内积为0时,它们线性无关。 A 和 A 的共轭转置的列向量的秩分别对应于 T 和 T* 的值域的维度,能不能就此证明它们相等?从而至少可以证明实数矩阵 行秩等于列秩。这就是下面的: 定理1 : 线性映射的值域和其对偶映射的值域有相同的维数。 证明:设 T 是从 U 到 V 的线性映射,则 T 的对偶映射 T* 是从 V 到 U 的线性映射。设 T 与 T* 的值域的维数分别为r,s, 假设s ,则在T* 值域中可以找一组基底: ,考虑,这个向量组的秩s ,因此可以在的值 域中 ( 维数为 r 找到使得。又 因为故即。这样我们在 的值域中找到了与向量都垂直的非零向量,与这个向量
10、组是值域的基底矛盾。因此 sr 。 同理可证 sr 。故 s=r 。证毕。 这样,A 与A 的 共轭转置 的列 秩相等,从而 实数 矩阵的行秩等 于列秩。 为了把它应用于证明复数矩阵行秩与列秩相等,还需要下面的命题: 命 题1 :若 复 数 值 向 量a1,a2, ,an 线 性 无 关 , 那 么 他 们的 共 轭 向 量 也 线 性 无 关 。 证明:以 a1,a2, ,an 为系数矩阵的方程组k1a1+k2a2+knan=0 两边取共轭即得到一个以a1,a2, ,a n 的共轭为系数的线性 方程组,这两个方程组同时有或没有非零解。证毕。 这样就彻底完全地证明出了矩阵的行秩与列秩相等。这个
11、证明的思路中就明显地带有几何的启示,因此我觉得它更能让我看 到矩阵行向量和列向量的本质。然而虽然这个证明带有很强的几何色彩,但终究还是觉得有些抽象,还是没有道出行列向量 之间的关系来。 经过对这个问题持续的思考,和对方程组 AX=0 从不同的角度去解释,发现如果我们竖着看 AX ,我们看到一个线性映射, 它列向量的秩是它值域的维数;然而如果我们横着看 AX=0 ,又可得到 A 的每个行向量与 X 的内积是 0(这里以实数矩阵为 例,至于复数矩阵则可以利用上面的“ 命题 1” ),也就是说, A 的每个行向量和AX=0 的解都垂直,用映射的观点说,就是 A 的每个行向量都在线性映射的零空间的正交
12、补空间中。又AX=0 的所有解的集合(零空间)是垂直于A 的每个行向量的 向量构成的集合,那么零空间和行空间应该互为正交补空间,它们的维数之和是定义域的维数。那么事情就清楚了,根据秩 -零度定理, dim rangeT+dim nullT 是 T 定义域的维数,而行空间维数又与零空间维数互补,因此行空间维数等于值域维数, 即行秩等于列秩。 应该说,这才是行向量和列向量真正的本质关系,可惜的是,直到毕业的三年多之后我才自己发现了这个关系。 其实,如果考虑对偶映射,也可以轻而易举地得出结论:T* 的值域恰是 T 的零空间的正交补。根据秩-零度定理也立即可以 得出 T* 和 T 值域维数相等。前面在
13、证明“ 定理 1” 时没有用到它们值域和零空间的关系还有秩-零度定理,这里用了这两个定 理之后,分析过程其实和上段分析 AX=0 方程组的过程本质上是一样的。 那时在网络上还查找到了一个利用了矩阵乘积的现代观点证明行秩等于列秩的文章,是在台湾博客“ 线代启示录 ”中看到 的,抄录如下(注意在台湾,把竖着的叫行,把横着的叫列,与我们恰好相反): 假設階矩陣的行秩為,列秩為。可知包含個維線性獨立的行向量,它們足以擴張 的 行 空 間 。 將 這 些 行 向 量 收 集 起 來 組 成 一 個階 矩 陣, 那 麼的 任 何 一 個 行 都可以唯一表示為的行向量之線性組合,如下: 將這個式子的線性組合
14、權重合併為一個階矩陣,並利用以行為計算單元的矩陣乘法規 則,就有 接著再考慮矩陣的第列,以表示,利用以列為計算單元的矩陣乘法規則,於是有 矩陣的每一列都可以寫為 D 的列向量之線性組合,因此的列空間維度不大於 D 的列向量總數,即,也就是說 的列空間維度不大於的行空間維度。 運用同樣的推論方式於,可推知的列空間維度不大於的行空間維度,但的列空間即為A 的行空間而 的行空間就是的列空間,得知。綜合以上結果,證得,矩陣的行秩等於列秩。這個證明方法表面看 似平凡無奇,但它只利用矩陣乘法運算便將幾個重要的線性代數概念線性組合、基底和擴張連結在一起,非常值得初學 者細細品味。 这个证明虽然也是代数上的分
15、析,但其巧妙的让人称奇的地方,就是把一个矩阵分解成了两个矩阵的乘积,其 中左边的因子是列慢秩的,然后利用对两个矩阵乘积的不同的解释,把左面的列秩(也就是A 的列秩)和右 面的行秩联系起来了。 本来,有关矩阵列秩与行秩关系的问题讨论到这里也可以算是比较圆满了。但是,在写这篇文章的时候,又无 意间提出下面的一个问题: 为什么如果矩阵A 只有两行,哪怕它有100列,它的列向量的秩也最多是2? 现在来看,这是个非常简单的问题,因为它的100 个列向量都是二维的向量,这些二维向量再多,也至多可以 找出两个线性无关的向量。这是由向量空间的维数定理保证的:“ 有限维向量空间中任何极大线性无关组包含 向 量
16、个 数 相 同 。 ”因 此 , 一 个 矩 阵 , 它 的 列 秩 不 超 过 行 数 , 行 秩 不 超 过 列 数 。 那么,为了完成“ 列秩等于行秩” 的证明,只需把列秩和行秩的大小范围估计得更精确一些,从“ 列秩小于等于 行数 ” 、“ 行秩小于等于列数” 精确到 “ 列秩小于等于行秩” 、“ 行秩小于等于列秩” 。我们设想,如果一个m*n 阶 矩阵,它的行秩为r,那么它的列向量虽然表面上看每个都是m 维的,但实际上这些m 维向量被限制在了一 个r 维 的 子 空 间 中 , 实 际 属 于r 维 向 量 。 为 了 看 清 楚 这 一 点 , 我 们 可 以 有 两 条 思 路 :
17、 第一条,既然 A 的行空间维数为 r,那么可以找到 r 个线性无关的行向量为基底,矩阵的 m 个行向量都可以用 这 r 个向量线性表示,用矩阵的语言就是 其中 D 就是从 A 的行向量中选取的线性无关行向量,B 的每一行是 A 的行向量按D 中行向 量线性表示的系数(坐标)。那么,接下来还是两条路:第一,按维数定理,D 的列秩不超 过其行数 r ,且 A 的值域维数不大于 D 的值域维数(因为 A 的维数就是把 D 的值域再用 B 映射到 m 维空间,值域的维数是递减的),因此 A 的列秩不大于 r ,这实质上是北大 线性代数中的证明;第二,B 的列秩不超过 B 的列数 r ,这样就变成了“
18、线代启示录” 的证明,因此“线代启示录”上的证明思路也就是如此。 第二条,我们可以实际地找出列空间的基底。因为行秩为,即可以选取个行向量 , 使 得 其 它 行 向 量 都 可 以 用 这个 行 向 量 线 性 表 示 , 不 妨 记 为 ,那么就代表的列向量的坐标都具有如下形式: 显然只有前 r 个坐标是可以自由变化的,这样的向量的全体构成一个子空间,它的基底是清 楚的。因此,这是个 r 维子空间。根据维数定理,这样的向量不管多少个,秩不大于r 。 可见,一个简单的事实,可以从多种角度进行的解释,但有些看似动机不同的解释往往实质 上又相同,它们之间也有着千丝万缕的联系。因为线性代数的这个特点
19、,使得不同的线性代 数的教材的写法有很大的不同。同样一个事实,既可以从线性映射的角度去解释,又可以从 矩阵分析的角度解释,还可以从线性方程组,或行列式角度去证明。线性代数教材的编写其 实很随意,既可以像北大版那样把线性方程组作为基础,其它诸如线性变换、维数定理等等 内容都通过方程组理论来证明,也可以像Linear Algebra Done Right那样完全地从抽象 的向量空间和线性映射的角度分析。它们动机虽然不同但是要认识的对象是同构的。 但是,如果当初满足于这个定理的书本上的证明,我是不可能对它挖掘得这么深,也不可能 认识到这些东西的。这里我还是要对以北大版高等代数为代表的教材提一些意见。
20、 可能大部分人都认为,线性方程组是线性代数中最易懂最易理解的部分,学生又有中学解多 元一次方程组的基础知识,线性方程组又可以引申出线性代数的诸多内容,因此是最适合用 于大学一年级学生入线代之门的内容。但是这样做有两个问题: 一个是如果只提方程组,学生无法想象它的几何形象,学生学习时头脑中形成的往往只是变 动的符号,不利于深入理解线性代数,更不利于发挥想象力去主动发现知识。如果说当学生 学到线性空间、线性变换的时候自然会学习到这些几何观念,那么在线性方程组之后,线性 空间和线性变换之前,还要学习矩阵理论,同样是没有几何直观,并且比方程组更难理解, 到了线性空间的时候学生已经云里雾里了,哪里还有信
21、心去学习接下来的东西?李炯生版 线性代数的前言部分说,“研究线性空间以及线性空间关于线性变换的分解即构成了线 性代数的几何理论,而研究短阵在各种关系下的分类问题则是线性代数的代数理论。”那么 到底是先代数后几何,还是先几何后代数,还是二者同时进行?如果先代数后几何,就像在 没有学习平面几何的时候学习解析几何,并且要预先学习曲线方程的性质,不见曲线只见方 程,等把方程的性质在代数上讨论清楚了,再带你认识它们实质上的几何形象,再用这些方 程的性质简单推导出几何的性质。但这是一个非常糟糕的学习方式。更糟糕的是一些理工科 专业线性代数学得更浅,甚至只学到矩阵部分,只记住了矩阵的运算等莫名奇妙的符号在头
22、 脑中搬来搬去,至于为什么那么计算,学过之后考高分的学生也不知道。这里有孟岩的三篇 csdn博 文 为 证 , 尤 其 是 博 文 开 头 几 段 话 , 道 出 了 一 般 理 工 科 学 生 的 疑 问 。 理解矩阵(一) 理解矩阵(二) 理解矩阵(三) 另一个问题是,这样的组织缺少发展理论框架的动机,为什么要引入线性相关,线性无关, 为什么要讨论矩阵?为什么有了消元法还要讨论行列式和 Cramer 法则?如果都是以解方程 为目的,这些内容统统没有动机,只要一个消元法,最后能够写出通解形式,就够了。似乎 矩阵、向量空间等内容都是方程组问题生发出来的,研究它们又有什么用途?这些问题开始 不讲
23、清楚,学生厌学,到后续课程真正用到这些知识的时候后悔莫及。 因此,我主张不论是编写教材,还是老师讲授,学生学习,都应该起点底,观点高,让学生 可以从各个不同方向去“围攻”一个问题,从各种不同的角度去看待一个知识,即使只是为 了讲代数,几何方面的直观思想和动机也要讲清楚,甚至这些更为重要。不妨在讲解线性方 程组的时候就开始讲讲方程组中蕴含的向量空间、线性变换等高级内容的道理,即不光讲高 斯消元法等方程的传统内容,还要用线性变换那样的几何观点解释方程组解的结构等等问 题,并用三维的几何图形(不妨用电脑中的数学软件或flash动画,至少是图片)来展示线 性代数中那些概念背后的几何形象,使学生一开始就
24、有丰富的几何代数经验,一开始就发现 这部分数学的魅力。 理解矩阵与矩阵乘积 (一) 线性代数中,有那么几个神秘又神奇的东西,总是让初学它的人琢磨不透,无法理解。今天 讨论线性代数中第二个既基本又神奇的东西:矩阵的乘法。 回想起我们中学的那个时代,从初中到高中,数学课的内容完完全全是初等数学,纯粹的向 量思想在数学课上不占有一席之地,中学阶段只有学习物理或复数的时候才能接触一点向量 的身影。即使在最应该体现向量思想威力的地方,也因为只讨论二维的简单情形而省略掉 了,只剩下纯粹的从几何角度推导代数性质,比如,直线方程,不是用向量法推导直线方程 的一般形式,而是用定比分点;两直线垂直的条件,不是用向
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 不同 角度 矩阵 解析
链接地址:https://www.31doc.com/p-4989226.html