ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

余弦距离和欧氏距离,知道原理和公式后真的很简单

2021-12-26 09:03:36  阅读:244  来源: 互联网

标签:差异 用户 距离 余弦 欧氏 向量


余弦距离

我们来看下公式,其实就是余弦计算公式:A和B是两个任意向量,除以它们模的乘积,就得到它们夹角的余弦值,其中向量Ai和Bi是向量A和B的每一个分量。
在这里插入图片描述

简单来说,余弦相似度,就是计算两个向量间的夹角的余弦值。

余弦距离就是用1减去这个获得的余弦相似度。

余弦值取值范围为[-1,1],余弦距离取值范围为[0,2],这样就满足了非负性的性质。

是不是很简单~

欧式距离

欧式距离我们从初中或者说小学就开始使用了,就是计算距离空间中的两点的实际距离。
在这里插入图片描述
这里的p为点(x1,y1)与点(x2,y2)之间的欧氏距离,当然扩展到多维空间中,公式就拓展到:
在这里插入图片描述
是不是更简单~

选择依据

总体来说,欧氏距离体现数值上的绝对差异,而余弦距离体现方向上的相对差异。

  1. 统计两部剧的用户观看行为,用户A的观看向量为(0,1),用户B为(1,0);此时二者的余弦距很大,而欧氏距离很小;我们分析两个用户对于不同视频的偏好,更关注相对差异,显然应当使用余弦距离

  2. 而当我们分析用户活跃度,以登陆次数(单位:次)和平均观看时长(单:分钟)作为特征时,余弦距离会认为(1,10)、(10,100)两个用户距离很近;但显然这两个用户活跃度是有着极大差异的,此时我们更关注数值绝对差异,应当使用欧氏距离

标签:差异,用户,距离,余弦,欧氏,向量
来源: https://blog.csdn.net/qq_42257666/article/details/122143048

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有