ローカルエンジン
ローカルエンジンとは、機械学習推論、データ処理、またはアプリケーションロジックなどの複雑なプロセスを、リモートのクラウドサーバーにのみ依存するのではなく、エンドユーザーのデバイス(例:スマートフォン、ラップトップ、IoTデバイス)上で直接実行するように設計された計算フレームワークまたはソフトウェアモジュールを指します。
これは、すべての重い処理が集中型データセンターで行われる従来のクラウドベースのアーキテクチャとは大きく異なります。
ローカルエンジンへの移行は、低遅延、強化されたユーザープライバシー、および運用上の回復力という重要なニーズによって推進されています。処理がローカルで行われる場合、アプリケーションは継続的で高速なインターネット接続への依存度が低下します。
ビジネスアプリケーションにとって、これはより良いユーザーエクスペリエンス(UX)と、接続が悪い環境でミッションクリティカルな機能を展開できる能力に直接つながります。
ローカルエンジンは通常、最適化され軽量化されたモデル(多くの場合、より大きなクラウドモデルの量子化または枝刈りされたバージョン)を活用し、それらはデバイス固有のハードウェア(CPU、GPU、または専用のニューラルプロセッシングユニット - NPU)で効率的に実行されるようにコンパイルされます。
ワークフローには、エッジ展開のためのモデル変換、ローカルデータ取り込み、リアルタイム推論の実行、およびローカル結果の表示が含まれます。
エッジコンピューティング、TinyML、フェデレーテッドラーニング、オンデバイス推論