第03章機器學習如何放大偏見也能修復偏見

你問「中間是不是模型？」答案是：是，而且不止一個模型。一個典型內容系統至少包含表徵模型、排序模型和反饋模型。

3.1 模型如何放大偏見

訓練數據本身就帶有歷史偏見。模型學到的「正確」，只是「歷史上被測量到的多數」。
例如：搜尋「CEO」的圖片，主要是西方男性——不是因為模型偏見，而是因為訓練數據裡就是這樣。

用戶點擊 → 模型學習 → 推送更多同類 → 更多點擊 → 更強偏見
這是個正反饋系統，一旦啟動，偏見會自我加速。

在目標函數中加入公平性約束：
「在最大化用戶滿意度的同時，確保不同族群/觀點的曝光比例不低於 X%」

推薦系統可以刻意推送「不確定性高、用戶未看過」的內容，打破繭房邊界。
這就是 ε-greedy 策略或 Thompson Sampling 在現實中的應用。

矩陣（狀態空間） × 目標函數 = 模型行為

改變目標，模型就會訓練出完全不同的行為。
這是為什麼「監管」必須作用在目標函數層，而不只是模型層。

機器學習不是中立的工具。它是人類目標的放大器。
放什麼目標進去，它就放大什麼結果出來。
這是我們都需要理解的基本認知素養。