空间是贯穿整个线性代数的主干脉络和核心概念。下面我们学习利用向量这个工具对空间进行定量描述。
关于向量
直观地说,把一组数字排列成一行或一列,就称为向量。它可以作为对空间进行描述的有力工具。
如一个简单的二维向量[4,5]⊤,这个向量有两个成分:第一个成分是数字4,第二个成分是数字5。其可以理解为二维平面中x坐标为4,y坐标为5的一个点,也可以理解为以平面中的原点(0,0)为起点,(4,5)为重点的一条有向线段,这就是二维向量的空间表示。一个向量中成分的个数就是该向量的维数。
不过,向量也不局限于用来直接描述空间中的点坐标和有向线段,也可以凭借基础的数据表示功能,成为一种描述事物属性的便捷工具。
如你的考试成绩为:语文85分,数学92分,英语89分。由于这三门课具有不同科目属性,因此,可以使用一个三维向量来对其进行表示,即score=[85,92,89]⊤。此时不仅仅可以把向量score看作是一个盛放数据的容器,似乎也可以利用它讲科目考试成绩和空间建立起某种关联。
又如,在自然语言处理中,也少不了向量这个重要的工具。程序在进行文本阅读时,首先会对文本材料进行分词处理,然后使用向量对词汇进行表示。这是因为向量很适合将对象的属性和特征对应到高维空间中进行定量表达,同时在此基础上进行进一步的后续处理,如判断词汇之间的相似性等。
我们陆续接触到一些数据处理的基本方法:如投影、降维等,这些方法都是在向量描述的基础上实现的。
列向量
向量对应地就拥有两种表达方式:若元素是纵向排列的,就称为列向量;若元素是横向排列的,就成为行向量。在没有特殊说明的情况下,一般都默认为列向量。为什么会偏爱列向量呢?主要是为了方便后续的向量坐标变换、空间之间的映射等计算过程的处理。
将一个矩阵A所表示的映射作用于某个向量x上时,习惯上将其写成矩阵乘以向量的表达形式,即Ax。这种写法的数据表示基础就是:向量x必须是一个列向量。