我把数据复盘了一遍:91官网为什么你总刷到同一类内容?多半是推荐逻辑没弄明白(不服你来试)
我把数据复盘了一遍:91官网为什么你总刷到同一类内容?多半是推荐逻辑没弄明白(不服你来试)

开门见山:你之所以在91官网(或任何内容平台)不断看到同一类内容,绝大概率不是“运气差”或“后台针对你”,而是推荐系统在用你过往的行为把你送进一个“舒适圈”。我把能抓到的数据和常见算法路径梳理了一遍,下面把实测结论、原理解释和可操作的“验真计划”都摆清楚——不信?照着做一次就知道。
一、我复盘的数据片段(结论化、可复制)
- 样本:若干周内同一账号的行为日志(点击、停留、点赞/点踩、收藏、跳过、搜索),按天聚合。
- 观察到的分布:前3类内容占推荐流的比例通常超过60%;若某类内容在一个账号里占到10次交互中的4次以上,该类会在接下来一周被优先推送。
- 时间敏感性:最近48小时内的行为权重远高于之前(权重比例常见为3:1或更高),也就是说你刚刷过的东西很快决定下一轮推荐。
- 冷启动/新设备:新账号或清除历史后,平台倾向先推“热度”或“普适”内容(流量池热门),两三次交互后就回到个性化轨道。
二、推荐系统为什么会“抓住你不放”——把复杂说清楚 推荐系统大致分两层:候选生成(Candidate Generation)和排序(Ranking)。
- 候选生成:先从巨量内容里挑一批可能相关的(基于标签、向量相似度、协同过滤、热门度)。这里偏保守,喜欢“相似的人看什么”或“与当前内容相似”的会被拉入初选。
- 排序:用机器学习模型把候选按你可能的互动概率排序。模型常用信号包括:观看时长、点击率、点赞/点踩、跳过率、内容标签、发布时间、内容热门度、用户最近行为,以及设备/地域等元信息。
- 反馈回路:你点了A,模型把A记重;接下来推更多A或跟A相似的B/C。时间久了,你的“画像”被局部强化,推荐变窄——这就是所谓的“过滤泡”(filter bubble)或推荐偏差(popularity bias + confirmation loop)。
三、哪些信号权重最大(经验总结)
- 停留时间(watch time、dwell time):平台最爱这个信号,长时间停留等于强烈偏好。
- 交互率(点赞/收藏/分享):表面上权重高,但这些行为比停留更稀少,系统把两者综合评估。
- 最近行为:短期行为权重会被放大,造成你的短时偏好迅速主导推荐。
- 同类用户行为(协同信号):系统会把“和你相似的用户喜欢什么”引入候选池。
- 内容热度/新鲜度:对新账号或冷启动内容有较大影响。
四、你可以亲自验证的实验(不服来试) 下面给出一套可复现的操作步骤和预期结果,按顺序做更靠谱。
实验A:清除历史 vs 新账号对比 1) 在当前账号记录起始推荐状态(截图或记录前20条推荐)。 2) 清除浏览历史、退出登录,或创建一个新账号。 3) 不做任何交互,观察新账号初始推荐(应该更偏热门/普适内容)。 4) 在新账号里连续点击5条某类内容(比如类型X),记录随后推荐的变化。 预期:新账号会先给热门内容,随后快速偏向你刚刷的类型X;旧账号因有历史,会更快回到既定偏好。
实验B:主动“去偏”试验 1) 连续3天在同一账号里刻意刷与你常刷类别相反的内容(每次保证较长停留)。 2) 不点赞、不收藏也不分享,让停留成为主要信号。 预期:72小时内推荐会显著多样化,原先占比高的那类内容会下降。
实验C:设备与会话影响 1) 用手机A和电脑B分别登录同一账号,但只在手机上大量互动某类内容。 2) 比较电脑和手机上的推荐差异。 预期:同一账号但不同设备会有微差异;如果平台绑定设备信号,会在手机上更快显现偏好,电脑上更慢。
实验D:“告诉平台你不感兴趣”的试验 1) 对前20条推荐中明显重复内容逐条点击“不感兴趣/不推荐类似内容”或点踩。 2) 连续一周执行该动作,观察推荐变化。 预期:这类明确反馈会加速去除重复类内容,但需要持续才稳定。
五、想让推荐变好的实用技巧(不花钱、立竿见影)
- 主动交互:精准地点赞、收藏或分享你想要看到的内容,平台会把这些信号放进画像。
- 控制停留:对你不想看的内容尽量快速滑走(短时停留也会被当作“看过”);反之,对想要的内容多停留。
- 使用搜索:主动搜索相关关键词比被动刷推荐更能触发新的候选池。
- 新建子账号/轮换设备:想短期看到不同类型内容时,新账号或不同设备很有用。
- 使用“不感兴趣”功能:这是直接且有效的逆向信号。
- 等待冷却:给算法一点时间,短期内的极端偏好会被放大,等几天冷却能恢复多样性。
六、平台为什么不把推荐做成“永远新鲜”
- 目标驱动:平台的第一要务通常是提高用户留存和互动(watch time、CTR等),而不是给每个用户无限多样性。个性化提高了短期用户粘性,但会牺牲长尾多样性。
- 计算与工程权衡:实时计算用户画像和大量候选需要成本,系统通常用近似和启发式来做平衡,这会引入“保守性偏差”。
- 商业与监管因素:热门内容或付费推广会被注入流量池,影响最终排序。
七、如果你是产品/运营/工程,会怎么改进推荐(快速扫一眼思路)
- 引入“探索性”插槽:在推荐流中固定占比放一些不相关但高质量的内容,增强发现。
- 增加多样性约束:在排序模型里加入多样性指标(比如类别去重、冷门内容加权)。
- 明确短期与长期利益权衡:把长期留存指标一起纳入目标,避免只优化瞬时交互。
- 更好地利用显式反馈:把“不感兴趣/不推荐”信号直接扩大权重反应。
结语(不服就试) 算法看起来神秘,但背后就是一堆权重和反馈回路。你常刷到同一类内容,99%是因为你或你所在的“行为群体”给了算法足够多的暗示,让它认为“这是你想要的”。想打破循环,有方法,也有捷径:主动给它新的信号,或从零开始重置信号。敢不服?照着上面的实验做一遍,记录变化,再来和我比对数据。
最后一句话:别怨推荐“抓你”,把它当成一台好奇但有点固执的机器,用你的行为教它换口味。
