标签:idf 笔记 IDF frequency 词频 tf TF
TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术。TF是词频(Term Frequency),IDF是逆文本频率指数(Inverse Document Frequency)。
还是比较简单的,整理了资料供大家观看。
tf(term frequency )-统计词频
idf(inverse document frequency)-逆文档频率
比如在多篇文档中一个词经常出现像to,I,is,这种词语不能作为关键词,所以idf就会让这种词的权重很小,这样tf-idf算法就会让在少数文档中而且词频还高的词tf-idf值大,按值的大小从大到小排序
参考资料
TF-IDF算法介绍及实现_Asia-Lee-CSDN博客_tf-idf
刘建平先生关于tf-idf的博客
标签:idf,笔记,IDF,frequency,词频,tf,TF 来源: https://blog.csdn.net/weixin_43332715/article/details/122274128
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。