低遅延キャッシュ
低遅延キャッシュとは、頻繁にアクセスされるデータをアプリケーションやエンドユーザーにより近い場所に保存するように設計された高速なデータストレージ層です。その主な機能は、データベースやリモートAPIなどのより遅いプライマリデータソースにクエリを送信する代わりに、この高速なローカルストアからデータリクエストを処理することです。この文脈における低遅延とは、リクエストが送信されてからデータが返されるまでの最小限の遅延時間を指します。
現代のトラフィックの多いアプリケーションでは、データベースクエリが重大なボトルネックを引き起こす可能性があります。ユーザー満足度と運用効率にとって、ミリ秒単位が重要です。低遅延キャッシュを実装することにより、組織はバックエンドデータベースへの負荷を劇的に軽減し、運用コストの削減とエンドユーザーへの応答時間の大幅な短縮を実現できます。
このプロセスは一般的に「キャッシュアサイド」パターンに従います。アプリケーションがデータを必要とする場合、まずキャッシュをチェックします。データが存在する場合(「キャッシュヒット」)、即座に返されます。データが存在しない場合(「キャッシュミス」)、アプリケーションはプライマリデータベースからデータをフェッチし、将来の使用のためにキャッシュにコピーを保存してから、ユーザーにデータを返します。
低遅延キャッシュは、いくつかの分野で極めて重要です。
関連する概念には、Time-To-Live (TTL) ポリシー、ライトスルーキャッシュ、リードスルーキャッシュ、および結果整合性があります。