第三课:算法是如何"喂养"你的大脑的
第三课:算法是如何"喂养"你的大脑的
“当你不为产品付费时,你自己就是产品。” —— 互联网时代的经典格言
你的数字画像:比你更了解你
打开你的手机,看看你安装了多少个App。每一个App都在默默收集你的数据:
- 你的位置:你在哪里,去过哪里,在某个地方停留了多久
- 你的搜索:你搜过什么,什么时候搜的,搜完之后点了哪个结果
- 你的社交:你关注了谁,谁关注了你,你跟谁聊天最多
- 你的消费:你买过什么,看过什么商品,在哪个页面停留最久
- 你的行为:你什么时候拿起手机,什么时候放下,平均每次看多久
这些数据汇聚在一起,形成了一个你的"数字画像"(Digital Profile)。
据Google的一位工程师在2011年就透露,Google至少会参考 57种不同的数据信号 来为你定制搜索结果——包括你的电脑类型、浏览器语言、所在城市,甚至你是否登录了Google账户。
到2026年,这个数字恐怕已增长了几个数量级。
算法对你的了解,很可能已经超过了你最亲密的朋友对你的了解。
推荐系统的三驾马车
现代互联网的推荐系统主要基于三种策略:
1. 协同过滤(Collaborative Filtering)
基本逻辑:“和你类似的人喜欢什么,你也可能喜欢。”
如果用户A和用户B都喜欢了内容X和内容Y,而用户A还喜欢了内容Z,那么算法就会把内容Z推荐给用户B。
这就是为什么你经常看到"喜欢这个的人也喜欢……"的推荐。
潜在问题:协同过滤会把你归入一个"类别",然后用这个类别的平均偏好来定义你。你作为个体的独特性被抹平了。
2. 内容过滤(Content-Based Filtering)
基本逻辑:“你过去喜欢什么类型的内容,就继续给你更多类似的内容。”
如果你看了三个关于健身的视频,算法就会推断你对健身感兴趣,然后给你推更多健身视频。
潜在问题:这创造了一个自我强化的循环——你看健身视频→算法推更多健身视频→你看更多健身视频→算法更加确定你只对健身感兴趣。你原来可能还对烹饪、摄影、历史感兴趣,但这些兴趣在算法眼中逐渐消失了。
3. 混合深度学习推荐
现代平台(如TikTok/抖音、YouTube)使用的是远比上述两种更复杂的深度学习模型。这些模型会综合考量数百甚至数千个特征:
- 你在这个视频上停留了多少秒
- 你是否看完了整个视频
- 你看完后是继续滑动还是评论了
- 你的滑动速度(快速滑过说明不感兴趣)
- 你点了赞还是点了"不感兴趣"
- 视频的文字、画面、音乐特征
- 当前的时间、你的实时情绪状态
TikTok的推荐引擎可以在你注册后的30分钟内,仅凭你的观看行为(甚至不需要你点赞或评论),就准确预测你的兴趣偏好。
2026年的研究表明,TikTok的个性化推荐系统通过微交互(观看时长、重播、暂停、跳过)来快速学习用户偏好,使平台在预测和强化用户兴趣方面具有独特的效率。无限滚动、自动播放、短视频格式等界面特征进一步放大了推荐系统的力量。
一个关键概念:参与度最大化
理解推荐算法的关键,是理解它的 目标函数(Objective Function)——算法在优化什么?
答案不是"给你最好的信息",也不是"让你变得更聪明"。
答案是:最大化你的参与度(Engagement)。
参与度可以是:
- 停留时间(你在平台上花了多少时间)
- 互动次数(你点了多少次赞、评论、分享)
- 回访频率(你多常打开这个App)
- 会话深度(每次打开App后使用多长时间)
对平台来说,你的参与度直接转化为广告收入。你在抖音上每多停留1分钟,抖音就多了1分钟向你展示广告的机会。
这意味着算法有动力给你看能让你"停不下来"的内容——而不是对你最有价值的内容。
什么样的内容最能让人"停不下来"?研究表明:
- 情绪激烈的内容——愤怒、恐惧、惊讶比平静的内容更能吸引注意力
- 确认你既有观点的内容——人们天然喜欢"我早就知道!"的感觉
- 社会争议性内容——争吵比共识更"有趣"
- 悬念和好奇——“你绝对想不到接下来发生了什么”
于是,一个残酷的机制浮出水面:让你愤怒的内容比让你思考的内容更有"算法价值"。
信息投喂的恶性循环
让我们用一张图来理解信息茧房的形成机制:
你的兴趣/偏好
↓
算法分析你的行为数据
↓
推荐匹配你偏好的内容
↓
你消费这些内容(点击、停留、点赞)
↓
算法确认:你果然喜欢这类内容
↓
推荐更多类似内容(更极端、更纯粹)
↓
你的偏好被进一步强化和窄化
↓
(循环继续……)
这个循环有一个关键特征:它是自我加速的。
每一轮循环都会让你的"信息食谱"更加单一。就像一个只给你喂糖的厨师——第一天你吃了一点糖,觉得甜;第二天厨师给你更多糖,你吃了更多;一个月后,你已经无法接受任何不甜的食物了。
Google的"个性化"实验
2009年12月4日是一个鲜为人知的分水岭。从这一天开始,Google对所有用户实施了搜索结果个性化——即使你没有登录Google账户。
Google通过Cookie、设备信息、IP地址等数据来追踪你,即便你是"匿名"浏览。
2018年,搜索引擎DuckDuckGo进行了一项研究:让87位不同地点的美国成年人同时搜索三个关键词:“immigration”(移民)、“gun control”(枪支管控)和"vaccinations"(疫苗接种)。
结果发现:即使是在隐私浏览模式下,大多数人看到的搜索结果也是独特的。 Google为不同的人展示了不同的链接,新闻和视频模块的差异尤为显著。
Google的搜索联络官Danny Sullivan回应称"搜索个性化基本是一个神话",但研究数据显示了截然不同的结论。
“看不见的编辑”
在传统媒体时代,报纸有编辑,电视台有审片人。这些人虽然也有偏见,但至少他们是人——有名有姓,可以被问责,有职业伦理约束。
Eli Pariser把算法推荐称为"看不见的编辑"(Invisible Editors)。他说:
“这些算法没有嵌入新闻编辑的职业伦理。它们只知道一件事:点击率。”
传统编辑在决定头版新闻时,会考虑"这件事重不重要?公众需不需要知道?"算法不会问这些问题。算法只会问:“这个用户会不会点?”
这意味着真正重要但不"吸睛"的信息——比如一项影响深远的法律变更、一个缓慢发展的环境危机——可能永远不会出现在你的信息流中。
而一条哗众取宠的谣言,只要点击率高,就会被算法大力推荐。
当"重要性"被"参与度"取代,我们的集体注意力就被从真正重要的事情上转移了。
思考题
- 打开你的抖音/小红书,仔细观察前20个推荐内容。它们是否呈现了一种"趋势"?这种趋势反映了你的真实兴趣,还是算法塑造的兴趣?
- 你认为"参与度最大化"和"用户价值最大化"之间有矛盾吗?平台有可能同时实现两者吗?
- 如果你是一个推荐算法的设计者,你会用什么作为目标函数?为什么?
延伸阅读
- Jaron Lanier,《十个让你删掉社交媒体账号的理由》
- 纪录片《监视资本主义:智能陷阱》(The Social Dilemma, 2020)
- Shoshana Zuboff,《监视资本主义时代》