一、融合策略
1、热度榜
(1)数据源
猫眼热度排序、淘票票热度排序
(2)融合策略
a.策略一 : 平均排名
不填充数据,有一个排名,就以一个作为基准;有两个排名,就计算两个的平均值。
(3)热度值转换
上述策略得到的score是平均排名,score越小,热度越热,score越大,热度越低。
根据业务需要,将该排名映射为10000以内的数,最终选择的映射函数是反正切函数,核心代码如下:
val hot = 10000 - 2 / math.Pi * FastMath.atan(index / 40) * 10000
2、口碑榜
(1)数据源
豆瓣评分、猫眼评分、淘票票评分
(2)融合策略
a. 只有一种评分
豆瓣(0.99)、猫眼(0.95)、淘票票(0.92)
b. 只有两种评分
i. 有豆瓣(豆瓣0.6,其他0.4)
ii. 无豆瓣(猫眼0.65,淘票票0.35)
c. 三种都有
0.5 * 豆瓣 + 0.3 * 猫眼 + 0.2 * 淘票票
(3)2022.01.21最新策略
只过滤出含有豆瓣评分的院线电影,并直接根据豆瓣评分进行排序
3、票房榜
(1)数据源
猫眼、淘票票(暂时没有数据)
(2)数据融合策略
票房是统一的口径,融合时先碰到哪个平台有票房,就用哪个平台的票房数据
(3)排序
将字符串票房转换成Double型的数字,该数字的含义是<百万>,票房榜只需据此降序排列即可。
标签:榜单,评分,热度,淘票票,豆瓣,数据源,院线,猫眼 来源: https://www.cnblogs.com/renyang/p/16487828.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。