ニューラルエンジン
ニューラルエンジンは、システム・オン・チップ(SoC)に統合されることが多く、人工知能(AI)および機械学習(ML)モデルが必要とする集中的な数学的演算を処理するために特別に設計された専用の処理ユニットです。汎用CPUや標準的なGPUとは異なり、ニューラルエンジンはディープラーニングの基盤をなす並列行列乗算と畳み込みに最適化されています。
リアルタイム画像認識、自然言語処理、予測分析などの複雑なAIアプリケーションの台頭は、膨大な計算能力を要求します。従来のプロセッサはこれらのモデルを実行する際に非効率的になる可能性があり、高い遅延と大幅な消費電力につながります。ニューラルエンジンは、専用の非常に効率的なハードウェアアクセラレーションを提供することでこの問題に対処し、複雑なAIタスクをローカルで、より速く、より少ないエネルギー消費で実行できるようにします。
その核となる部分で、ニューラルエンジンは極度の並列性でニューラルネットワークの計算を実行するように設計されています。これは、訓練されたモデルを使用して予測を行うプロセスである推論を非常に高速に実行するように設計されています。これは、数千の乗算・加算演算(MAC)が同時に発生することを可能にする特殊なシストリックアレイまたは類似の構造を通じて達成されます。この特殊化により、汎用命令セットに関連するオーバーヘッドを回避し、ニューラルネットワークに内在する反復的で構造化された計算に理想的になります。
ニューラルエンジンは、多くの最新技術における重要なコンポーネントです。
ニューラルエンジンを利用する主な利点は、パフォーマンス、効率、遅延の3点です。
強力である一方で、ニューラルエンジンへのデプロイと最適化には課題があります。モデルの量子化(重みと活性化の精度を低下させること)は、モデルをエンジンの制約内に効率的に収めるためにしばしば必要です。さらに、開発者は、MLグラフをエンジンの独自のアーキテクチャに効果的にマッピングするように特別に最適化されたフレームワークとコンパイラを使用する必要があります。