第03章機械学習はどのように偏見を増幅し修正できるか

「中間はモデルですか？」と聞きました。答えはイエスです——そして一つ以上のモデルがあります。典型的なコンテンツシステムには、少なくとも表現モデル、ランキングモデル、フィードバックモデルが含まれます。

3.1 モデルがどのように偏見を増幅するか

学習データには歴史的な偏見が含まれています。モデルが「正しい」と学ぶことは、「歴史的に最も測定されたもの」に過ぎません。

例えば：「CEO」の画像を検索すると、主に西洋の男性が表示されます——モデルが偏っているからではなく、学習データがそれを反映していたからです。

ユーザーのクリック → モデルが学習 → システムがより多くの同じものを提供 → より多くのクリック → より強い偏見

これはポジティブフィードバックシステムです。一度始まると、偏見は自己加速します。

目的関数に公平性の制約を追加する：
「ユーザー満足度を最大化しながら、いかなる人口統計グループや視点も総露出の X% 以上を受けるようにしてください。」

推薦システムは、バブルの境界を破るために「不確実性が高く、過去の露出が少ない」コンテンツを意図的に表示できます。
これは ε-greedy 戦略や Thompson Sampling の現実世界での適用です。

$$\text{行列（状態空間）} \times \text{目的関数} = \text{モデルの動作}$$

目標を変えると、モデルは完全に異なる動作へと訓練されます。
だからこそ規制は目的関数の層で機能しなければならないのです。モデルの層だけでなく。

機械学習は中立なツールではありません。それは人間の目標の増幅器です。

目標を入力すると、その結果が大規模に増幅されます。

これは私たち全員が今必要な基本的な認知リテラシーです。