标签:Similarity 余弦 Cosine 余弦定理 相似 相似性 计算公式 向量
余弦相似度,又称为余弦相似性,是通过测量两个向量的夹角的余弦值来度量它们之间的相似性。
两个方向完全相同的向量的余弦相似度为1,而两个彼此相对的向量的相似度为-1。 注意,它们的大小并不重要,因为这是方向的度量。
如何计算
余弦定理
余弦定理是三角形中三边长度与一个角的余弦值(cos)的数学式。
余弦定理指的是:
勾股定理则是余弦定理的特殊情况,当角为直角时,即:时,公式简化为
余弦的计算公式
所以余弦的计算公式如下:
a,b,c 是三个边的长度。
假定a向量是[x1, y1],b向量是[x2, y2],那么可以将余弦定理改写成下面的形式:
根据下面带入可以得上面公式
数学家已经证明,余弦的这种计算方法对n维向量也成立。假定A和B是两个n维向量,A是 [A1, A2, ..., An] ,B是 [B1, B2, ..., Bn] ,则A与B的夹角θ的余弦等于:
参考资料
- 9个数据科学中常见距离度量总结以及优缺点概述
- TF-IDF与余弦相似性的应用(一):自动提取关键词
- TF-IDF与余弦相似性的应用(二):找出相似文章
- AI产品经理需要了解的数据知识:余弦相似度
- 白话总结《余弦相似度vs欧式距离&缺陷》
- 算法工程师面试备战笔记4_余弦相似与欧氏距离有什么区别和联系
标签:Similarity,余弦,Cosine,余弦定理,相似,相似性,计算公式,向量 来源: https://www.cnblogs.com/ghj1976/p/yu-xian-xiang-shi-ducosine-similarity-xiang-guan-j.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。