为什么万事万物都可以表示成向量?半硅人Scott
本文回答 3 个问题:
什么是向量?为什么一个数字不够表示复杂对象?
为什么万事万物都可以表示成向量?
向量之间的运算,在 AI 里代表什么含义?
上一篇我们说,计算机最底层只认识数字。
但新的问题来了:文字、图片、声音,这些东西本来不是数字,怎么让计算机处理它们呢?
花5分钟读完本文,你就会明白:
向量其实就是用一组数字,从多个维度表示一个对象。万事万物皆可向量化。
▍问题 1:什么是向量
我们从一个生活中的例子开始。
假如现在 A 和 B 同时在追求你,你想比较一下这两个人,怎么办?
肯定不能只看一个维度,对吧?
只看学历,不行。学历高不代表人品好。
只看长相,也不行。长相好不代表相处舒服。
只看收入,也不行。收入高不代表三观合适。
所以你可能会列几个维度:
然后给每个维度打一个分。
比如 A:[8, 7, 9, 6, 5, 8]
B:[6, 9, 7, 8, 9, 6]
这种按照顺序写下来的数字,就是向量。
几个数字,就是几维向量。
2 维向量、3 维向量,还可以在坐标系里画出来对应的箭头。比如 [3, 4] 可以表示平面上的一个点,也可以表示从原点指向这个点的一支箭头。
4096 维你画不出来了,但数学上完全一样——只是它活在 4096 维空间里。
所以为了后面的理解更清楚,我们先用一个更朴素的说法:
向量 = 一串有顺序的数字,每个位置表示一个维度上的取值。
注意,顺序不能乱。
在刚才的例子里,第 1 个数字表示学历,第 2 个数字表示长相,第 3 个数字表示人品。如果你把顺序打乱,意思就变了。
所以向量不是随便一堆数字,而是:
按固定顺序排列的一组数字,用来表示一个对象。
一个数字只能表示一个维度。一串数字,才能表示一个复杂对象。
这就是向量最重要的直觉。
▍问题 2:为什么万物都可以表示成向量
2^266 ≈ 1.16 × 10^80
你怎么就知道:
“猫”的向量是 [0.12, 0.24, ..., 0.72, -0.84]
“汽车”的向量是 [0.31, -0.08, ..., 0.15, 0.62]
▍问题 3:向量运算代表什么含义
1. 向量的加法
把两个向量加起来:
[8, 7, 9, 6, 5, 8, 0]+[0, 0, 0, 0, 0, 0, 5]=[8, 7, 9, 6, 5, 8, 5]
这就是向量加法:同一个位置和同一个位置相加,把新信息加到对应维度上。


