今日头条的走红带动了「个性化推荐」的概念, 自此之后, 内容型的产品, 个性化算法就逐渐从卖点变为标配.
伴随着「机器学习」,「大数据」之类的热词和概念, 产品的档次瞬间提高了很多. 而各种推荐算法绝不仅仅是研发自己的任务, 作为产品经理, 必须深入到算法内部, 参与算法的设计, 以及结合内容对算法不断「调教」, 才能让产品的推荐算法不断完善, 最终与自己的内容双剑合璧.
本文以新闻产品为例, 结合了我之前产品从零积累用户的经验, 整理了作为 PM 需要了解的基本算法知识和实操.
算法的发展阶段
个性化推荐不是产品首次发布时就能带的, 无论是基于用户行为的个性化, 还是基于内容相似度的个性化, 都建立在大量的用户数和内容的基础上. 产品发布之初, 一般两边的数据都有残缺, 因此个性化推荐也无法开展.
所以在产品发展的初期, 推荐内容一般采用更加聚合的「热度算法」, 顾名思义就是把热点的内容优先推荐给用户. 虽然无法做到基于兴趣和习惯为每一个用户做到精准化的推荐, 但能覆盖到大部分的内容需求, 而且启动成本比个性化推荐算法低太多.
因此内容型产品, 推荐在发布初期用热度算法实现冷启动, 积累了一定量级以后, 才能逐渐开展个性化推荐算法.
热度算法
1, 热度算法基本原理
需要了解的是, 热度算法也是需要不断优化去完善的, 基本原理:
新闻热度分 = 初始热度分 + 用户交互产生的热度分 - 随时间衰减的热度分
Score = S0 + S(Users) - S(Time)
- distance(E,A)=4.123 (用户 A 没有阅读 news2, 因此 news2 的数据不能用来计算与用户 E 的相似度, 这里取 1,3)
- distance(E,B)=3.162
- distance(E,C)=3.742
- distance(E,D)=1.414
来源: http://www.tuicool.com/articles/NRbQv2B