标签:协同 权重 Jaccard 评分 余弦 算法 过滤 相似
(注:这里不再对算法公式累述)
1.相似度算法
1.1Jaccard距离
使用集合中的不同元素的比例来衡量两个集合的区分度,但是存在比较明显的问题无法关注到集合中元素的权重值(评分)
1.2余弦相似度
利用向量空间解决了权重值(评分)带入相似度计算的问题,非常常用的相似度算法,弥补了Jaccard距离计算的不足
1.3Pearson相似度(又名中心余弦相似度)
Pearson相似度是对余弦相似度改进,简明来说就是将权重值(评分)减去权重的平均值,可以理解为将权重值相对于整体占比带入到特征中,均值中心化处理对算法的准确性有一定的提高
2.奇异值分解(SVD)降维
当数据量过多的时候,相似度计算的负荷显著增大,这时候使用SVD进行降维可以有效的减轻计算负担
标签:协同,权重,Jaccard,评分,余弦,算法,过滤,相似 来源: https://blog.51cto.com/13665344/2421962
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。