1.8 线性变换介绍
矩阵方程 和对应的向量方程 之间的差别仅仅是记号上的不同,然而,矩阵方程还可以由线性代数中其他问题以及应用(例如计算机图形、信号传递等)所引起,而不仅是直接与向量线性组合的问题有关. 通常的情况是把矩阵 A当作一种“对象”,它通过乘法“作用”于向量 x,产生的新向量称为Ax .
例如,方程
乘以矩阵A 后,将 x变成 b,将 u变成零向量,见图1-34.
由这个新观点,解方程 就是要求出 中所有经过乘以 A的“作用”后变为b 的向量 x.
由 x到Ax 的对应是由一个向量集到另一个向量集的函数. 这个概念推广了通常的函数概念,通常的函数是把一个实数变为另一个实数的规则.
由 到 的一个变换(或称函数、映射)T 是一个规则,它把 中每个向量 x对应以 中的一个向量 T(x). 集 称为T 的定义域,而 称为 T 的余定义域(或取值空间). 符号T :==> 说明T 的定义域是 而余定义域是 ,对于 中向量 x, 中向量T(x) 称为 x(在 T作用下)的像. 所有像 T(x)的集合称为 T的值域. 见图1-35.
本节的新名词是非常重要的,因为矩阵乘法的动态观点对理解线性代数和建立时变物理系统的数学模型起着关键作用. 这样的动力系统将在1.10节、4.8节、4.9节以及第5章进行讨论.
矩阵变换
本节以下内容研究有关矩阵乘法的映射. 对 中每个 x, T(x)由Ax 计算得到,其中 A是 m*n矩阵,为简单起见,有时将这样一个矩阵变换记为 ,注意当 A有 n列时,T的定义域为 ,而当A 的每个列有m 个元素时,T的余定义域为 . T的值域为 A的列的所有线性组合的集合,因为每个像T(x) 有Ax 的形式.
例1 设 ,定义变换 ,于是
- 求 u在变换T下的像T(u) .
- 求 中的向量 x,使它在T下的像是向量b .
- 是否有其他向量在T下的像也是 b?
- 确定 c是否属于变换T的值域.
解 a. 计算
- 解 T(x)=b,即解Ax=b ,或
![li1_a_1](https://yqfile.alicdn.com/79e97ddb6cb8370ab980671b7bb45109be9738ee.png) (1)
应用1.4节的方法,把增广矩阵进行行变换:
![li1_a_2](https://yqfile.alicdn.com/6f31e178bfbfab6f9c60904efcf578e96ff29db3.png) (2)
因此 ,这个向量x在T下的像是给定的向量 b.
- 任意x,若它在T下的像是b ,它必满足(1),由(2)知方程(1)的解是唯一的,所以仅有一个x使它的像是b .
- 若 c是 中某个x在T下的像,则它属于T的值域,也就是说,对某个x,c=T(x) ,这就是说,要问方程组Ax=c 是否相容,为找出答案,把增广矩阵进行行变换:
第3个方程是0=-35,说明方程组不相容,因此 c不属于T的值域.
例1(c)的问题是方程组的唯一性问题: b是否 中唯一的x的像?类似地,例1(d)是存在性问题:是否存在 中x使它的像为 c?
下面两个矩阵变换有很明确的几何意义,它们加强了矩阵作为向量变换的动态观点,2.7节包含了其他有关计算机图形学的有趣例子.
例2 若 ,则变换 把 中的点投影到 坐标平面上,因为
见图1-36.
例3 设 ,变换T: 定义为 T(x)=Ax 称为剪切变换. 可以说明,若 T作用于图1-37的2*2正方形的各点,则像的集构成带阴影的平行四边形. 关键的想法是证明 T将线段映射成为线段(如习题27所示),然后验证正方形的4个顶点映射成平行四边形的4个顶点. 例如,点 的像为 , 的像为 . T 将正方形变形,正方形的底保持不变,而正方形的顶拉向右边. 剪切变换出现在物理学、地质学与晶体学中.
线性变换
1.4节定理5表明,若 A是m*n 矩阵,则变换 有以下性质:
u,v是 中任意向量, c是任意数. 这些性质若用函数记号来表示,就得到线性代数中最重要的一类变换.
定义 变换(或映射)T称为线性的,若
(i)对 t的定义域中一切u,v ,.
(ii)对一切 u和标量 c, .
每个矩阵变换都是线性变换,非矩阵变换的线性变换的重要例子将在第4、5章中讨论.
线性变换保持向量的加法运算与标量乘法运算. 性质(i)说明先将 中的u 和v相加然后再作用以T 的结果T(u+v) 等于先把 T作用于u 和v 然后将 中的 T(u)和T(v) 相加. 由这两个性质容易推出下列性质:
若 T是线性变换,则
T(0)=0 (3)
且对 的定义域中一切向量 u和v 以及数c 和d 有:
![1_4_a_4](https://yqfile.alicdn.com/d170fe18bc4782351ec16a91d7412b31eadfbff9.png) (4)
性质(3)由(ii)得出,因 T(0)=T(0u)=0T(u)=0.性质(4)由(i)和(ii)推出:
![1_4_a_4_1](https://yqfile.alicdn.com/9e6300cf4bb336e22ebab03d2afbb31c9b5aa143.png)
若一个变换满足(4),它必是线性的.(取 c=d=1可得(i),取d=0 可得(ii).) 重复应用(4)得出有用的推广:
![1_4_5](https://yqfile.alicdn.com/285cec55d43dc92a6d240c2df7f089b896f6b5a8.png) (5)
在工程和物理中,(5)式称为叠加原理. 设想 为进入某个系统的信号, 为系统对这些信号的响应. 系统满足叠加原理,若某一输入可表示为这些信号的线性组合,则系统的响应是对各个信号的响应的同样的线性组合. 我们将在第4章研究这一思想.
例4 给定标量 r,定义 . 当0<=r<=1 时,T 称为压缩变换,当 r>1时 T称为拉伸变换. 设 r=3,证明 T是线性变换.
解 设u,v 属于 ,c,d 为数,则
因满足(4),于是T 是线性变换. 见图1-38.
例5 定义线性变换T:为
求出 在T 下的像.
解
注意 T(u+v)等于 T(u)+T(v). 由图1-39可知,T 把u,v 和 u+v逆时针向旋转90°. 事实上,T 把由 u和 v确定的平行四边形变换成由T(u) ,T(v)确定的平行四边形(见习题28).
最后的例子不是几何的,它说明线性变换如何把某一类型的数据变成另一种类型的数据.
例6 某公司生产两种产品B和C. 使用1.3节例7中的数据,我们构造“单位成本”矩阵U=[b,c] ,它的各列描述“每美元产出成本”:
产 品
设 为“产出”向量,对应于产品 B和 美元及产品 C和 美元,定义T: 为
变换 将一列产出数量(以美元计算)变换为一列总成本. 该变换是线性的,体现在两方面:
1.若产量增加4倍,由 x增加到 4x,则成本也乘以同一因子,由T(x) 增加到aT(x) .
2.若x 和y 为产出向量,则对应产出向量x+y 的总成本恰好等于成本向量T(x) 和 T(y)之和. ?
练习题
习题1.8