假设有两个向量A和B,分别为A=[1,2,3,4]和B=[2,4,6,8]。

欧式距离:

欧式距离公式为:

d(A,B) = sqrt((A1-B1)^2 + (A2-B2)^2 + ... + (An-Bn)^2)

代入A和B的值,得到:

d(A,B) = sqrt((1-2)^2 + (2-4)^2 + (3-6)^2 + (4-8)^2)

= sqrt(1 + 4 + 9 + 16)

= sqrt(30)

因此,A和B的欧式距离为sqrt(30)。

余弦相似度:

余弦相似度公式为:

cos(A,B) = (A·B) / (||A|| * ||B||)

其中,A·B表示向量A和向量B的点积,||A||表示向量A的模长,||B||表示向量B的模长。

代入A和B的值,得到:

A·B = (12 + 24 + 36 + 48) = 2 + 8 + 18 + 32 = 60

||A|| = sqrt(1^2 + 2^2 + 3^2 + 4^2) = sqrt(30)

||B|| = sqrt(2^2 + 4^2 + 6^2 + 8^2) = sqrt(120)

因此,A和B的余弦相似度为cos(A,B) = 60 / (sqrt(30) * sqrt(120)) ≈ 0.970。

广义Jaccard系数:

广义Jaccard系数公式为:

J(A,B) = |A∩B| / (|A| + |B| - |A∩B|)

其中,A∩B表示向量A和向量B的交集,|A|表示向量A的元素个数,|B|表示向量B的元素个数。

代入A和B的值,得到:

A∩B = {2,4}

|A| = 4

|B| = 4

因此,A和B的广义Jaccard系数为J(A,B) = 2 / (4 + 4 - 2) = 0.25。

皮尔森相关系数:

皮尔森相关系数公式为:

r(A,B) = cov(A,B) / (std(A) * std(B))

其中,cov(A,B)表示向量A和向量B的协方差,std(A)表示向量A的标准差,std(B)表示向量B的标准差。

代入A和B的值,得到:

cov(A,B) = E[(A-E[A])(B-E[B])] = (1-2.5)(2-5) + (2-2.5)(4-5) + (3-2.5)(6-5) + (4-2.5)*(8-5) = 15/4

std(A) = sqrt(E[(A-E[A])^2]) = sqrt((1-2.5)^2 + (2-2.5)^2 + (3-2.5)^2 + (4-2.5)^2) = sqrt(5/3)

std(B) = sqrt(E[(B-E[B])^2]) = sqrt((2-5)^2 + (4-5)^2 + (6-5)^2 + (8-5)^2) = sqrt(14/3)

因此,A和B的皮尔森相关系数为r(A,B) = 15/4 / (sqrt(5/3) * sqrt(14/3)) ≈ 0.996。

计算题:欧式距离、余弦相似度、广义Jaccard系数、皮尔森相关系数示例计算

原文地址: https://www.cveoy.top/t/topic/fYMb 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录