NVIDIA L40S

データセンターの AI とグラフィックスで発揮される比類なきパフォーマンス。

この製品の販売開始時に通知を受け取る。

最もパワフルな汎用 GPU

NVIDIA L40S GPU で画期的なマルチワークロードパフォーマンスをご体験ください。パワフルな AI コンピューティングとこのクラスで最高のグラフィックスとメディア高速化を組み合わせた L40S GPU は、生成 AI や LLM (大規模言語モデル) の推論とトレーニングから 3D グラフィックス、レンダリング、ビデオまで、次世代のデータセンターワークロードにパワーを与えます。

NVIDIA とグローバルデータセンターシステムのメーカーが生成 AI と産業のデジタル化を強化

OVX サーバーは、NVIDIA GPU を搭載し、トレーニングや推論、グラフィックスを多用するワークロードを高速化します。Dell、Hewlett Packard Enterprise、Lenovo、Supermicro などから近日発売されます。

ハイライト

ユニバーサルな性能

Tensor パフォーマンス

1,466 TFLOPS¹

RT コアパフォーマンス

212 TFLOPS

単精度演算性能

91.6 TFLOPS

¹ ピークレートは GPU ブーストクロックに基づきます。

特長

NVIDIA Ada Lovelace アーキテクチャ採用

第 4 世代 Tensor コア

構造的なスパース性と最適化された TF32 形式のハードウェアサポートによるパフォーマンス向上で、AI とデータサイエンスのモデルトレーニングが高速化します。AI で強化するグラフィックス機能を DLSS で加速させ、一部のアプリケーションで解像度を格段にアップさせます。

第 3 世代 RT コア

スループットとコンカレントレイトレーシングとシェーディング機能が強化され、レイトレーシングのパフォーマンスが向上し、製品設計や建築、エンジニアリング、建設のワークフローのレンダリングが高速化されます。実際に動作している実物のようなデザインをご覧ください。ハードウェアによりモーションブラーを高速化し、驚異的なリアルタイムアニメーションを実現しています。

CUDA コア

単精度浮動小数点 (FP32) スループットの高速化と電力効率の向上により、3D モデル開発や CAE (Computer-Aided Engineering) シミュレーションなどのワークフローでパフォーマンスが大幅に向上します。混合精度ワークロード向けの拡張 16 ビット演算機能 (BF16) を使用。

Transformer Engine

Transformer Engine は AI パフォーマンスを劇的に加速し、トレーニングと推論の両方でメモリ使用率を改善します。Ada Lovelace の第 4 世代 Tensor コアのパワーを利用する Transformer Engine は、Transformer アーキテクチャニューラルネットワークの層をインテリジェントにスキャンし、FP8 と FP16 の精度を自動的に再構築してより高速な AI パフォーマンスを実現し、トレーニングと推論を加速します。

効率性とセキュリティ

L40S GPU は、24 時間 365 日稼動するエンタープライズデータセンター運用に最適化されており、最大限のパフォーマンス、耐久性、アップタイムを確保するために、NVIDIA によって設計、構築、テスト、サポートされています。L40S GPU は最新のデータセンター標準を満たし、NEBS (Network Equipment-Building System) レベル 3 に対応し、Root of Trust 技術によるセキュアブートを備え、データセンターにさらなるセキュリティ層を提供します。

DLSS 3

L40S GPU は、NVIDIA DLSS 3 により超高速のレンダリングと滑らかなフレームレートを可能にします。この画期的なフレーム生成技術は、Ada Lovelace アーキテクチャと L40S GPU のディープラーニングと最新のハードウェアイノベーション (第 4 世代 Tensor コアやオプティカルフローアクセラレータなど) を活用し、レンダリング性能を高め、FPS (フレーム毎秒) を上げ、レイテンシを大幅に改善します。

NVIDIA Ada Lovelace GPU アーキテクチャの詳細を見る

ワークロード

マルチワークロードの高速化

生成 AI

新しいサービス、インサイト、オリジナルコンテンツを開発します。

次世代の AI、グラフィックス、メディアの高速化機能を備えた L40S は、前世代の NVIDIA A40 と比較して最大 5 倍の推論性能と、NVIDIA HGX™ A100 の 1.2 倍の性能を実現します。‌画期的な性能と 48 ギガバイト (GB) のメモリ容量を備え、マルチモーダルの生成 AI ワークロードを高速化するのに理想的なプラットフォームです。

生成 AI の詳細を見る

LLM のトレーニングと推論

AI のトレーニングと推論のワークロードを高速化します。

FP8 をサポートする第 4 世代 Tensor コアは、卓越した AI コンピューティングパフォーマンスを提供し、最先端の LLM と生成 AI モデルのトレーニングと推論を高速化します。

NVIDIA AI 推論の利点を見る

レンダリングと 3D グラフィックス

NVIDIA RTX™ グラフィックスで忠実度の高いクリエイティブワークフローにパワーを与えます。

第 3 世代 RT コアは、前世代の最大 2 倍のリアルタイムレイトレーシングパフォーマンスを提供し、インタラクティブレンダリングからリアルタイムの仮想制作まで、驚異的なビジュアルコンテンツと忠実度の高いクリエイティブワークフローの制作にパワーを与えます。

NVIDIA RTX テクノロジの詳細を見る

NVIDIA Omniverse

メタバースアプリケーションの作成と運用をします。

NVIDIA Omniverse™ は、次世代の産業デジタル化アプリケーションの接続、開発、運用を可能にします。パワフルな RTX グラフィックスと AI 機能を備えた L40S は、Omniverse で構築された Universal Scene Description (OpenUSD) ベースの 3D ワークフローとシミュレーションワークフローに優れたパフォーマンスを提供します。

NVIDIA Omniverse の詳細を見る

仕様

NVIDIA L40S GPU

FP32	91.6 teraFLOPS
TF32 Tensor コア	366 teraFLOPS*
FP16	733 teraFLOPS*
FP8	1,466 teraFLOPS*
RT コアパフォーマンス	212 teraFLOPS
最大消費��力	350W
* スパース性対応

仕様をすべて見るデータシートを見る

今すぐ始める

NVIDIA L40S GPU の販売開始時に通知を受け取る

パートナーを探す

GPU アーキテクチャ	NVIDIA Ada Lovelace アーキテクチャ
GPU メモリ	48 GB GDDR6 (ECC 搭載)
メモリ帯域幅	毎秒 864GB
相互接続インターフェイス	PCIe Gen4 x16: 毎秒 64GB 双方向
NVIDIA Ada Lovelace アーキテクチャベースの CUDA® コア	18,176
NVIDIA 第 3 世代 RT コア	142
NVIDIA 第 4 世代 Tensor コア	568
RT コアパフォーマンス TFLOPS	212
FP32 TFLOPS	91.6
TF32 Tensor コア TFLOPS	183 I 366*
BFLOAT16 Tensor コア TFLOPS	362.05 I 733*
FP16 Tensor コア	362.05 I 733*
FP8 Tensor コア	733 I 1,466*
ピーク INT8 Tensor TOPS ピーク INT4 Tensor TOPS	733 I 1,466* 733 I 1,466*
フォームファクター	4.4" (H) x 10.5" (L)、デュアルスロット
Display Ports	4x DisplayPort 1.4a
最大消費電力	350W
電源コネクタ	16 ピン
サーマル	パッシブ
仮想 GPU (vGPU) ソフトウェアサポート	あり
サポートされている vGPU プロファイル	仮想 GPU ライセンスガイドを見る
NVENC I NVDEC	3x \| 3x (AV1 エンコード/デコードを含む)
信頼の基点 (Root of Trust) による Secure Boot	あり
NEBS Ready	レベル 3
マルチインスタンス GPU (MIG) サポート	なし
NVIDIA® NVLink® サポート	なし
* 疎性あり