第03章 機器學習如何放大偏見也能修復偏見

第03章 機器學習如何放大偏見也能修復偏見

作者:Angel Zhang & Charlie Cao

你問「中間是不是模型?」答案是:是,而且不止一個模型。一個典型內容系統至少包含表徵模型、排序模型和反饋模型。

3.1 模型如何放大偏見

3.1.1 表徵偏差(Representation Bias)

訓練數據本身就帶有歷史偏見。模型學到的「正確」,只是「歷史上被測量到的多數」。
例如:搜尋「CEO」的圖片,主要是西方男性——不是因為模型偏見,而是因為訓練數據裡就是這樣。

3.1.2 反饋迴路放大(Feedback Loop Amplification)

用戶點擊 → 模型學習 → 推送更多同類 → 更多點擊 → 更強偏見
這是個正反饋系統,一旦啟動,偏見會自我加速。

3.2 模型如何修復偏見

3.2.1 約束優化(Constrained Optimization)

在目標函數中加入公平性約束:
「在最大化用戶滿意度的同時,確保不同族群/觀點的曝光比例不低於 X%」

3.2.2 探索機制(Exploration)

推薦系統可以刻意推送「不確定性高、用戶未看過」的內容,打破繭房邊界。
這就是 ε-greedy 策略或 Thompson Sampling 在現實中的應用。

3.3 模型是中間層,目標是靈魂

矩陣(狀態空間) × 目標函數 = 模型行為

改變目標,模型就會訓練出完全不同的行為。
這是為什麼「監管」必須作用在目標函數層,而不只是模型層。

3.4 章節小結

機器學習不是中立的工具。它是人類目標的放大器。
放什麼目標進去,它就放大什麼結果出來。
這是我們都需要理解的基本認知素養。