たまりば

出産・育児 出産・育児調布市 調布市

2025年03月15日

Nvidia、データセンター向け初の Ampere GPU を発表

Nvidia は、初の Ampere グラフィックス カードである A100 を発表しました。これは消費者向けカードではなく、一般向けに提供されています。




Nvidia CEO の Jensen Huang は本日、同社の次期グラフィックス アーキテクチャである待望の Ampere を発表しました。 CEO のキッチンを舞台とし、YouTube でストリーミングできる 6 部構成のシリーズは、主に高性能コンピューティング アプリケーションに焦点を当てていますが、NVIDIA の次世代コンシューマ グラフィックス カードに関連する興味深い事実や数値も多数含まれています。同じアーキテクチャ上にあります。




Ampere の最初の実装は A100 と呼ばれ、Nvidia によると、この 7nm GPU には 826mm² のダイに 540 億個のトランジスタが含まれています。 (文脈上、12nm GeForce RTX 2080 Ti には、同様の領域に約 190 億個のトランジスタしか含まれていません。) A100 は、倍精度浮動小数点計算で 19.5TF を達成できます。これは、AMD が最近発表した Radeon 7 Pro と比べてかなり優れています。約6.5TFを管理します。この驚異的なレベルのコンピューティングは、最大帯域幅 1.5TB/秒の 40GB の HBM2 メモリで支えられています。




A100 は、当然のことながら、データ分析や科学技術コンピューティングの想定されたユースケースにおいて、かなり優れたパフォーマンスを発揮しますが、単一 GPU で約 20,000 ドルと報告されている価格を備えた消費者向け製品とは程遠いものです。それでも、これは科学的取り組みにとっては実際には良い取引になる可能性があります。Nvidia は、ディープ ラーニング トレーニングや推論などの AI タスクにおいて、以前の Volta アーキテクチャと比較してパフォーマンスがおおよそ 6 倍から 7 倍向上すると主張しており、より良い価値提案になります。消費電力ははるかに少なくなります。 Volta ベースのサーバーのラック全体を 1 台の A100 に置き換えることができる可能性があります。処理能力にこれほどの変化が見られることはめったにありません。これは、間違いなく同じ Ampere アーキテクチャに基づいた Nvidia の将来の消費者向けの取り組みにとって良い兆候です。




新しいカードは、より効率的な 7nm プロセスの恩恵を受けるだけでなく、いくつかの新機能もサポートします。その 1 つは Tensor Float 32 と呼ばれるデータ型で、AI トレーニングで一般的に使用される 32 ビット浮動小数点数の範囲と 16 ビット浮動小数点の精度を取得することを目的としています。その結果、コードを変更する必要がなく、32 ビット浮動小数点を使用するプログラムは、代わりに適切な場合に TF32 データ型を使用し、A100 に含まれる第 3 世代 Tensor コアでより高速に実行されるようになります。このアーキテクチャはまた、いわゆる「疎」データセットをより効率的に処理し、基本的に未入力のエントリを無視して計算を高速化し、データセットが占有するメモリ量を削減します。複雑な AI モデルのトレーニングでは、数百万のエントリを含むデータセットを使用できるため、大幅な時間の節約につながる可能性があります。



https://game-player.click/Nvidia%E3%80%81%E3%83%87%E3%83%BC%E3%82%BF%E3%82%BB%E3%83%B3%E3%82%BF%E3%83%BC%E5%90%91%E3%81%91%E5%88%9D%E3%81%AE%20Ampere%20GPU%20%E3%82%92%E7%99%BA%E8%A1%A8/



  • Posted by 太郎くんのメモ at 20:24│Comments(0)
    上の画像に書かれている文字を入力して下さい
     
    <ご注意>
    書き込まれた内容は公開され、ブログの持ち主だけが削除できます。

    削除
    Nvidia、データセンター向け初の Ampere GPU を発表
      コメント(0)