この計算機能により、組織は機密性の高い個人情報を開示することなく、機械学習モデルのトレーニングとデプロイメントを行うことができます。クエリおよび勾配に調整された統計的なノイズを加えることで、特定の個人の存在または不在が、出力に大きな影響を与えないようにします。この手法は、厳格な規制要件を満たしつつ、ビジネスインテリジェンスおよび予測分析におけるモデルの有効性を維持します。
システムは、集計処理の前に、データセットの集約にラプラスノイズまたはガウスノイズを注入し、これにより、結果から個々のレコードを逆算することが不可能になります。
プライバシー予算は、モデルのトレーニングの各反復において動的に割り当てられ、時間の経過とともにプライバシーが侵害されるのを防ぎつつ、正確な予測に必要な十分な統計的精度を維持します。
敵対的分析を実施し、ノイズレベルが十分であることを検証することで、特定の人口統計グループや行動を標的とした推論攻撃から保護する効果を確認します。
クエリの感度を、単一のレコードの追加または削除によって引き起こされる出力の変化の最大値を計算することで定義します。
特定のデータセットに対して、組織のリスク許容度および規制遵守要件に基づき、プライバシー予算を割り当てます。
ノイズ注入アルゴリズムを実装し、そのスケールをシステムの感度に対して逆比例するように調整することで、トレーニング全体を通して指定されたε(イプシロン)値を維持します。
計算された集計値に導入されたランダム性にもかかわらず、統計的な有用性が十分に保たれていることを確認するため、出力分布を検証します。
生データストリームは、差分プライバシーパイプラインに投入される前に、検証され、機密レベルが付与されます。
バックプロパゲーション中の勾配更新において、特定の計算タスクに割り当てられたグローバルなプライバシー予算に応じて、ランダムな摂動が加えられます。
エンドユーザーは、集計クエリを送信し、その結果にはノイズが追加されます。これにより、個々のレコードがデータセット全体から数学的に区別できなくなるようになっています。