NVIDIA L40S

データ センターの AI とグラフィックスで発揮される比類なきパフォーマンス。

この製品の販売開始時に通知を受け取る。

最もパワフルな汎用 GPU

NVIDIA L40S GPU で画期的なマルチワークロード パフォーマンスをご体験ください。パワフルな AI コンピューティングとこのクラスで最高のグラフィックスとメディア高速化を組み合わせた L40S GPU は、生成 AI や LLM (大規模言語モデル) の推論とトレーニングから 3D グラフィックス、レンダリング、ビデオまで、次世代のデータ センター ワークロードにパワーを与えます。

NVIDIA とグローバル データ センター システムのメーカーが生成 AI と 産業のデジタル化を強化

OVX サーバーは、NVIDIA GPU を搭載し、トレーニングや推論、グラフィックスを多用するワークロードを高速化します。Dell、Hewlett Packard Enterprise、Lenovo、Supermicro などから近日発売されます。

ハイライト

ユニバーサルな性能

Tensor パフォーマンス

1,466 TFLOPS¹

RT コア パフォーマンス

212 TFLOPS

単精度演算性能

91.6 TFLOPS

1 ピーク レートは GPU ブーストクロックに基づきます。

特長

NVIDIA Ada Lovelace アーキテクチャ採用

第 4 世代 Tensor コア

構造的なスパース性と最適化された TF32 形式のハードウェア サポートによる パフォーマンス向上で、AI とデータ サイエンス のモデル トレーニングが高速化します。AI で強化するグラフィックス機能を DLSS で加速させ、一部のアプリケーションで解像度を格段にアップさせます。

第 3 世代 RT コア

スループットとコンカレント レイトレーシングとシェーディング機能が強化され、レイトレーシングのパフォーマンスが向上し、製品設計や建築、エンジニアリング、建設のワークフローのレンダリングが高速化されます。実際に動作している実物のようなデザインをご覧ください。ハードウェアによりモーション ブラーを高速化し、驚異的なリアルタイム アニメーションを実現しています。

CUDA コア

単精度浮動小数点 (FP32) スループットの高速化と電力効率の向上により、3D モデル開発や CAE (Computer-Aided Engineering) シミュレーションなどのワークフローでパフォーマンスが大幅に向上します。混合精度ワークロード向けの拡張 16 ビット演算機能 (BF16) を使用。

Transformer Engine

Transformer Engine は AI パフォーマンスを劇的に加速し、トレーニングと推論の両方でメモリ使用率を改善します。Ada Lovelace の第 4 世代 Tensor コアのパワーを利用する Transformer Engine は、Transformer アーキテクチャ ニューラル ネットワークの層をインテリジェントにスキャンし、FP8 と FP16 の精度を自動的に再構築してより高速な AI パフォーマンスを実現し、トレーニングと推論を加速します。

効率性とセキュリティ

L40S GPU は、24 時間 365 日稼動するエンタープライズ データ センター運用に最適化されており、最大限のパフォーマンス、耐久性、アップタイムを確保するために、NVIDIA によって設計、構築、テスト、サポートされています。L40S GPU は最新のデータ センター標準を満たし、NEBS (Network Equipment-Building System) レベル 3 に対応し、Root of Trust 技術によるセキュア ブートを備え、データ センターにさらなるセキュリティ層を提供します。

DLSS 3

L40S GPU は、NVIDIA DLSS 3 により超高速のレンダリングと滑らかなフレーム レートを可能にします。この画期的なフレーム生成技術は、Ada Lovelace アーキテクチャと L40S GPU のディープラーニングと最新のハードウェア イノベーション (第 4 世代 Tensor コアやオプティカル フロー アクセラレータなど) を活用し、レンダリング性能を高め、FPS (フレーム毎秒) を上げ、レイテンシを大幅に改善します。

ワークロード

マルチワークロードの高速化

生成 AI

新しいサービス、インサイト、オリジナル コンテンツを開発します。

次世代の AI、グラフィックス、メディアの高速化機能を備えた L40S は、前世代の NVIDIA A40 と比較して最大 5 倍の推論性能と、NVIDIA HGX™ A100 の 1.2 倍の性能を実現します。‌画期的な性能と 48 ギガバイト (GB) のメモリ容量を備え、マルチモーダルの生成 AI ワークロードを高速化するのに理想的なプラットフォームです。

生成 AI の詳細を見る

LLM のトレーニングと推論

AI のトレーニングと推論のワークロードを高速化します。

FP8 をサポートする第 4 世代 Tensor コアは、卓越した AI コンピューティング パフォーマンスを提供し、最先端の LLM と生成 AI モデルのトレーニングと推論を高速化します。

 

LLM のトレーニングと推論

レンダリングと 3D グラフィックス

NVIDIA RTX™ グラフィックスで忠実度の高いクリエイティブ ワークフローにパワーを与えます。

第 3 世代 RT コアは、前世代の最大 2 倍のリアルタイム レイトレーシング パフォーマンスを提供し、インタラクティブ レンダリングからリアルタイムの仮想制作まで、驚異的なビジュアル コンテンツと忠実度の高いクリエイティブ ワークフローの制作にパワーを与えます。

NVIDIA RTX テクノロジの詳細を見る

NVIDIA Omniverse

メタバース アプリケーションの作成と運用をします。

NVIDIA Omniverse™ は、次世代の産業デジタル化アプリケーションの接続、開発、運用を可能にします。パワフルな RTX グラフィックスと AI 機能を備えた L40S は、Omniverse で構築された Universal Scene Description (OpenUSD) ベースの 3D ワークフローとシミュレーション ワークフローに優れたパフォーマンスを提供します。

NVIDIA Omniverse

仕様

NVIDIA L40S GPU

FP32 91.6 teraFLOPS
TF32 Tensor コア 366 teraFLOPS*
FP16 733 teraFLOPS*
FP8 1,466 teraFLOPS*
RT コア パフォーマンス 212 teraFLOPS
最大消費���力 350W

今すぐ始める

NVIDIA L40S GPU の販売開始時に通知を受け取る

最新情報を入手する

ご登録いただくと、NVIDIA からデザインとビジュアライゼーション関連の最新情報をお届けします。

登録して提供開始時に通知を受け取る

NVIDIA L40S GPU 仕様

GPU アーキテクチャ NVIDIA Ada Lovelace アーキテクチャ
GPU メモリ 48 GB GDDR6 (ECC 搭載)
メモリ帯域幅 毎秒 864GB
相互接続インターフェイス PCIe Gen4 x16: 毎秒 64GB 双方向
NVIDIA Ada Lovelace アーキテクチャベースの CUDA® コア 18,176
NVIDIA 第 3 世代 RT コア 142
NVIDIA 第 4 世代 Tensor コア 568
RT コア パフォーマンス TFLOPS 212 
FP32 TFLOPS 91.6
TF32 Tensor コア TFLOPS 183 I 366*
BFLOAT16 Tensor コア TFLOPS 362.05 I 733*
FP16 Tensor コア 362.05 I 733*
FP8 Tensor コア 733 I 1,466*
ピーク INT8 Tensor TOPS
ピーク INT4 Tensor TOPS
733 I 1,466*
733 I 1,466*
フォーム ファクター 4.4" (H) x 10.5" (L)、デュアル スロット
Display Ports 4x DisplayPort 1.4a
最大消費電力 350W
電源コネクタ 16 ピン
サーマル パッシブ
仮想 GPU (vGPU) ソフトウェア サポート あり
サポートされている vGPU プロファイル 仮想 GPU ライセンス ガイドを見る
NVENC I NVDEC 3x | 3x (AV1 エンコード/デコードを含む)
信頼の基点 (Root of Trust) による Secure Boot あり
NEBS Ready レベル 3
マルチインスタンス GPU (MIG) サポート なし
NVIDIA® NVLink® サポート なし