为什么矩阵必须是正方形,这一点很重要?

2020-06-21 22:19:06

$\Beginggroup$我目前正在努力自学线性代数。我注意到很多术语(如特征向量、特征多项式、行列式等等)的定义都需要一个方阵,而不是任何实数矩阵。例如,Wolfram在其特征多项式的定义中具有以下内容:

特征多项式是特征方程$\det(A-i\lambda)=0$的左侧多项式,其中$A$是方阵。

为什么矩阵必须是正方形的?如果矩阵不是正方形,会发生什么?为什么方阵在这些定义中经常出现呢?如果这是一个非常简单的问题,我很抱歉,但我觉得我遗漏了一些基本的东西。

$\结束组$。

$\Begingroup$请注意,您不能计算非方阵的行列式。$\endgroup$-Arnaud Mortier。

$\Begingroup$@ArnaudMortier公平地说,我认为这将构成OP问题的另一个实例:为什么行列式只对方阵有意义?";$\endgroup$-n诺亚·施韦伯(Noah Schweber)。

奇异值定理是将方阵的大部分机器推广到$m\x n$矩阵的一个相当成功的尝试。这是通过对$A^Ta$进行谱分解来实现的,$A^Ta$也是对称的$\endgroup$-N8tron。

$\BEGINGROUP$注意,您提到的特征向量的定义等并不依赖于具有实值的矩阵。具有复数值的矩阵也同样有用(当然,实数矩阵可以视为复数矩阵的特例)。此外(正如N8tron所说)有一个非常强大的概念适用于非方阵,即奇异值分解(SVD)-尽管要了解它是什么以及它有什么好处,您需要先了解您提到的方阵概念,而SVD可能根本不会在第一堂线性分析课程中涉及。$\endgroup$-字母零

$\Begingroup$记住,具有实数条目的$n$x$m$矩阵表示从$\mathbb{R}^m$到$\mathbb{R}^n$的线性映射(或者更一般地,具有来自某些字段$k$的条目的$n$x$m$矩阵表示从$k^m$到$k^n$的线性映射)。当$m=n$时,也就是当矩阵为正方形时,我们讨论的是从空间到自身的映射。

为什么从空间到自身的地图-而不是从空间到其他东西的地图-特别有趣呢?

问题是,当我看一张从一个空间到它本身的地图时,地图的输入和输出都是相同的东西类型,所以我可以有意义地比较它们。因此,例如,如果$f:\mathbb{R}^4\right tarrow\mathbb{R}^4$询问$f(V)$何时与$v$平行是有意义的,因为$f(V)$和$v$位于同一空间中;但是询问$g(V)$何时与$v$对于$g:\mathbb{R}^4\right tarrow\mathbb{R}^3$平行';(顺便说一句,这个例子只是说当矩阵是正方形时,特征向量/值是有意义的,但当矩阵不是正方形时就没有意义了。)。

作为另一个例子,让我们考虑行列式。行列式的几何意义是,它度量线性地图(有符号)体积的单位有多大-例如,地图$(x,y,z)\mapsto(-2x,2y,2z)$将一个体积单位变为$-8$体积单位,行列式$-8$也是如此。有趣的是,这适用于每一个体积斑点:不管我们看的是贴图如何扭曲通常的1-1-1立方体,还是其他一些随机立方体。

但是,如果我们尝试从$3$D到$2$D(所以我们正在考虑一个$2$x$3$矩阵),或者反之亦然呢?嗯,我们可以试着用同样的想法:(按比例)一个给定的产量最终会产生多少面积?然而,我们现在遇到了问题:

如果我们从$3$涨到$2$,伸缩因子不再是不变的。考虑投影图$(x,y,z)\mapstto(x,y)$,并考虑当我垂直拉伸一点体积时会发生什么…。

如果我们从$2$涨到$3$,我们将永远得不到任何数量--起始量太小了!因此,不管我们看的是什么地图,我们的延伸系数似乎都是0美元。

问题是,在非正方形的情况下,被天真地解释为行列式的行列式要么定义不清,要么因为愚蠢的原因是$0。

$\结束组$。

我建议(正如甘道夫61的答案中顺带提供的那样)这个难题的另一个部分是,一旦你有了$n\x n$矩阵的集合,这个集合上还有一个自然的合成运算符,它可以接受任何两个成员并产生第三个成员;这不是任意维数的矩阵的情况,这个额外的结构带来了当你有一个矩阵时,你可以问的所有自然的问题。如果你有一个任意维数的矩阵,那么这个额外的结构就会带来你可以问的所有自然的问题,当你有一个矩阵时,这个额外的结构会带来你可以问的所有自然的问题,这是一个可以接受任何两个成员并产生第三个成员的集合;这不是任意维数的矩阵的情况,而且这个额外的结构带来了当你有一个。$\endgroup$-*Steven Stadicki。

$\BEGINGROUP$令人着迷!如果有这样的解释,我可能会更喜欢线性代数。$\endgroup$-1接近DarkessFish。

关于方阵为什么如此重要,已经有很多很好的答案了。但是,就像你不认为其他矩阵不有趣一样,它们有类似的逆(例如,摩尔-彭罗斯逆),非方矩阵有奇异值分解,其中奇异值起着松散类似于方阵的特征值的作用。这些主题通常在线性代数课程中被忽略,但它们在统计和机器学习的数值方法中可能很重要。但是在花哨的非方阵结果之前学习方阵结果,因为前者为后者提供了上下文。

$\结束组$。

线性代数矩阵中的$\BegingGroup$通常表示向量空间之间的线性变换。$m\x n$矩阵$M$表示从$\mathbb{R}^n$到$\mathbb{R}^m$的线性变换。

当矩阵为方阵($m=n$)时,可以认为它表示从$\mathbb{R}^n$到自身的变换。这就是特征值和特征多项式的概念有意义的时候。

$\结束组$

要添加到@Ethan的答案中的$\egingroup$线性映射从向量空间到自身的基本原理是,您可以将向量与其图像进行比较:

只有当结构域和共域重合时,所有这些问题才有意义(并且在线性映射上携带大量信息)。行列式、特征多项式等就是用来回答这些问题的。

$\结束组$。

$\Beginggroup$到目前为止,答案中没有明确说明的一点是,矩阵的幂只有在矩阵是平方的情况下才有意义。

方阵$\Mathcal{M}(A)$表示一个线性映射$A:V\right tarrow W$,它的整环$V$和其上整环$W$的维数相同,所以它的整环和上整环与向量空间同构(通常我们认为整环和上整环是相同的向量空间,但严格地说这不是必须的)。

如果$A$的区域和余域是同一向量空间,则我们可以将$A$与其自身合成,从而创建线性映射$A\CIRRC A$、$A\CIRRC A\CIRRC A$等。这些映射依次由方阵$\mathcal{M}^2$、$\mathcal{M}^3$等表示。这允许我们定义方阵的多项式函数,从而理解诸如Cayley-Hamilton定理之类的语句。

$\结束组$。

如果$A$的定义域和上定义域与向量空间同构,则我们可以将A与其自身合成-事实并非如此。域和共域必须相等,您才能将转换与其自身组合在一起。虽然方阵有时可能表示相同维度的不同空间之间的映射,但问题所询问的一切都是从空间到其自身的映射的内在属性,因此,我觉得提出行列式、特征多项式和特征向量不自然适用的不同语义情况并不是特别相关。$\endgroup$-1米洛·勃兰特

嗯,我不确定是否有人给出了一个简单的答案,那就是把矩阵的每一行看作是一组联立方程中未知数的系数。

方阵具有与未知数相同数量的方程式(假设所有行或列都不是彼此的倍数),因此表示一组方程式的左侧,该方程式很有可能有唯一解。

对于矩阵,从几何上考虑它们通常是有帮助的,但也经常将它们视为方程系数。

$\结束组$。

$\Beginggroup$对于矩阵$\mathbf{A}$要可逆,它必须是$n\x n$方阵,并且存在$n\x n$方阵$\mathbf{B}$,通过矩阵乘法运算,我们有。

$$\mathbf{AB}=\mathbf{BA}=\mathbf{i}_{n}\tag{1}$$其中$\mathbf{i}_{n}$表示$n\x n$单位矩阵。因此,此矩阵$\mathbf{B}$是唯一的,并称为$\mathbf{A}$的逆,表示为$\mathbf{A}^{-1}$。我们从(1)可以看出,矩阵必须是平方的,否则它们不会交换。方阵没有逆当且仅当其行列式为$0$,则称其为奇异矩阵。

具有可逆方阵的一个重要结果是可以对它们施加群结构。域$F$上所有$n\x n$可逆矩阵的集合在矩阵乘法下形成一个群,称为$n$次的一般线性群,或$\text{GL}(n,F)$,它们是非奇异的$n\x n$矩阵的集合。可以看出,两个可逆矩阵的乘积是可逆的,可逆矩阵$(\mathbf{A}^{-1})^{-1}=\mathbf{A}$的乘积是可逆的。

特殊线性群$\text{SL}(n,F)$是矩阵具有行列式$1$的$\text{GL}(n,F)$的子集,是它的正规子群。

考虑$\text{SL}(n,\mathbb{R})$:由于它的矩阵具有行列式$1$,因此从它下面的$\mathbb{R}^n\right tarrow\mathbb{R}^n$开始的线性映射在保持体积和方向的情况下被变换。

$\结束组$。

点击“发布您的答案”,即表示您同意我们的服务条款、隐私政策和Cookie政策。

不是你想要的答案吗?浏览标记的其他问题或提出您自己的问题。