フェデレーテッドベンチマーク
フェデレーテッドベンチマークとは、複数の地理的に分散した、またはサイロ化されたデータセットにわたって機械学習モデルが訓練またはテストされる際の性能、堅牢性、公平性を評価するために設計された、標準化された評価指標とテスト手順を指します。すべてのデータを単一の場所に集約する従来の集中型ベンチマークとは異なり、フェデレーテッドベンチマークはデータ局所性とプライバシーの制約を尊重しながら動作します。
今日のデータ駆動型の環境では、機密データ(医療記録や独自の顧客データなど)を常に一元化することはできません。フェデレーテッドラーニングにより、生のデータがそのソースから決して離れることなく、モデルがこの分散データから学習することが可能になります。フェデレーテッドベンチマークは、データが本質的にサイロ化されている本番環境を模倣した現実世界の分散条件下でモデルがうまく機能することを証明するための、信頼性が高く標準化された方法を提供するという点で極めて重要です。
このプロセスは通常、ベンチマークプロトコルを管理する中央オーケストレーターを伴います。参加するデータ所有者(クライアント)は、独自のデータを使用してモデルのローカルバージョンを訓練します。クライアントはデータを送信する代わりに、モデルの更新(勾配または重み)をオーケストレーターに送信します。オーケストレーターは、フェデレーテッドアベレージング(FedAvg)などの技術を使用してこれらの更新を集約し、グローバルで改善されたモデルを作成します。その後、ベンチマークは、様々なシミュレートされた、または実際のフェデレーテッド環境で、事前に定義された標準化されたタスクに対してこのグローバルモデルをテストします。
フェデレーテッドラーニング、差分プライバシー、モデルドリフト、分散コンピューティング。