1 两个向量之间的Cosine距离(余弦距离)

计算几何中可以使用Cosine距离夹角余弦)来衡量两个向量之间的距离,在机器学习中也可以使用Cosine距离衡量样本之间的差异。

假设有两个向量xy,则两个向量之间的cosine距离计算公式如下:

D(x,y) = \frac{x \cdot y}{\left | x \right | \left | y \right | }

其中,\cdot表示向量之间的内积,\left | \right |表示向量的模。

cosine距离(夹角余弦)取值范围为\left [ -1,1 \right ],值越大表示两个向量之间的夹角越小,两个向量方向差异越小,两个向量越相似;值越小表示两个向量之间的夹角越大,两个向量方向差异越大,两个向量越不相似。当两个向量的方向重合时取最大值1,当两个向量方向完全相反时取最小值-1。

参考