Radeon INSTINCT MI25
Radeon Instinctのサーバーアクセラレータ製品ファミリーは、メタルインテリジェンスとHPCシステムの異機種混在コンピューティング機能の新時代をもたらします。次世代の「Vega」アーキテクチャや、ROCmソフトウェアプラットフォームを介したデータセンター設計へのRadeon Instinctのオープンエコシステムアプローチなどの世界クラスのGPUテクノロジの導入により、より高度なデータセンターのパフォーマンスと効率が実現し、さまざまなシステムアーキテクチャのサポートと業界標準的な相互接続技術をもたらします。
Radeon Instinct製品ファミリーは、Deep LearningとHPCのデータセンターの新しい時代の構築ブロックとなるように設計されています。AMDは、Radeon Instinctのサーバアクセラレータ製品とソフトウェアプラットフォームを設計、最適化し、コスト効率の良いマシンと深い学習の推論、トレーニング、エッジトレーニングソリューションを提供しており、アクセラレータの高度な並列コンピューティング機能を最大限に活用できます。
Radeon Instinct製品は、学術、政府機関、エネルギー、ライフサイエンス、金融、自動車、その他の業界でデータ中心のHPCクラスのシステムにも理想的です。
比類なきハーフシングル単精度浮動小数点パフォーマンス 24.6 TFLOPS FP16または12.3 TFLOPS FP32ピークGPUの性能
Radeon Instinct MI25サーバーアクセラレータは、24.6 TFLOPS FP16または12.3 TFLOPS FP32ピークGPU、1枚のボードでパフォーマンスを計算することにより、コンピュータインテリジェントなマシンインテリジェンスおよびディープラーニングトレーニングアプリケーションに、単精度のパフォーマンスリーダーシップを提供します。MI25は、最も並列なHPCワークロードに対する強力なソリューションを提供します。MI25は、1/16レートで768 GFLOPSのピーク倍精度(FP64)も提供します。
16GB超高帯域幅HBM2 ECC GPUメモリ>512ビットメモリインタフェース、次世代の高帯域幅キャッシュとコントローラ、ECCメモリの信頼性において、前世代に比べ2倍のデータ転送速度の向上を実現しました。Radeon Instinct MI25の16GB HBM2 GPUメモリは、最も要求の厳しいデータ集約型マシンインテリジェンスとディープラーニングトレーニングアプリケーションを処理できるプロフェッショナルレベルのアクセラレータソリューションを提供します。
最大82 GFLOPS /ワットFP16または41 GFLOPS /ワットFP32ピークGPUの性能を発揮最大82 GFLOPS /ワットFP16または41 GFLOPS /ワットFP32ピークGPUコンピューティングパフォーマンスを備えたRadeon Instinct MI25サーバアクセラレータは、パフォーマンスと効率的な電力使用がROIに不可欠であるデータインテリジェンスおよびディープラーニングトレーニングアプリケーションに対して、ワットあたり比類のないパフォーマンスを提供します。MI25は、2.5 GFLOPS /ワットのFP64ピーク性能も提供します。
それぞれ64のストリームプロセッサを備えた64の計算ユニットRadeon Instinct™MI25サーバアクセラレータには64個のストリームプロセッサで構成された64個の計算ユニットがあり、合計4,096個のストリームプロセッサが使用可能で、フレキシブルな新型計算ユニットで新しく設計された計算エンジンを備えた次世代の「ベガ」アーキテクチャ(nCU)を使用して、より高い周波数で16ビット、32ビット、および64ビットの処理が可能になり、今日のダイナミックな作業負荷が大幅に軽減されます。Radeon Instinct MI25は、最も要求の厳しいコンピューティング集約的な並列マシンインテリジェンスとディープラーニングアプリケーションを効率的なパッケージで提供し、優れた単精度性能と柔軟性を提供します。
世界最先端のGPUメモリを搭載したAMDの次世代「Vega」アーキテクチャをベースに構築 14nmのFinFETプロセスを使用した次世代の「Vega」アーキテクチャに基づく受動的に冷却されたGPUサーバアクセラレータ
Radeon Instinct MI25サーバアクセラレータは、14nm FinFETプロセスを採用した新しい「Vega」アーキテクチャに基づいており、データセンターサーバの導入に最適化された演算密度向けに設計されたプロフェッショナルレベルのアクセラレータです。MI25サーバアクセラレータは、ワットあたりの性能が重要なマシンインテリジェンスやディープラーニングなどのHPCクラスのワークロードで、単精度の計算集中型トレーニングアプリケーションに最適なソリューションです。
300W TDPボードパワー、フルハイト、デュアルスロット、10.5 "PCIe®Gen 3 x16 GPUサーバーカードRadeon Instinct MI25サーバーPCIe®Gen3 x16 GPUカードは、ほとんどの標準的なサーバーデザインに適合するように設計されたフルハイトのデュアルスロットカードで、異機種のマシンインテリジェンスや深い学習トレーニング、HPCクラスのシステム展開
最大484 GB / sのメモリ帯域幅を備えた超広帯域HBM2 ECCメモリRadeon Instinct MI25サーバアクセラレータは、最も要求の厳しいマシンインテリジェンスとディープラーニングニューラルネットワークトレーニングシステムのより大きなデータセット要件を効率的に処理するために、16GBの最新の高帯域幅HBM2メモリで設計されています。MI25アクセラレータの16GB ECC HBM2メモリは、データ集約型HPCクラスのワークロードに最適なソリューションです。
MxGPU SR-IOVハードウェア仮想化Radeon Instinct MI25サーバアクセラレータは、AMDのMxGPU SRIOVハードウェア仮想化テクノロジをサポートするように設計されており、データセンターの利用率と容量を向上させます。
更新されたリモート管理機能Radeon Instinct MI25アクセラレータは、大規模システムでのGPU監視を簡素化するために、帯域外の管理性回路を進化させました。MI25の管理機能に関係なく、GPUが基板部の詳細を、シリアル番号、GPU温度、電力および他の情報を含むPMCI準拠したデータ構造を使用して、静的および動的GPU情報の範囲の高度な監視を提供しているI2Cを介してアクセスの可能性を提供します 。
今日、データインテリジェンスやデータセンターの深い学習アプリケーションのニューラルネットワークで使用されているトレーニングテクニックは非常に複雑になっており、それらのネットワークをトレーニングしてそのデータ内のパターンを認識する際に大量のデータを処理する必要があります。これには、多くのコアに渡って浮動小数点計算が多く必要とされ、従来のCPUは、GPUが処理するのと同じくらい効率的にこのタイプの計算を処理することができません。GPUを使用することで、CPUの計算に何週間もかかりますが、数日で処理することができます。Radeon Instinct MI25は、AMDの新しいEpycサーバープロセッサーとROCmオープンソフトウェアプラットフォームと組み合わせることにより、機械インテリジェンスや深い学習アプリケーションに優れたパフォーマンスを提供します。
4,096ストリームプロセッサで動作するMI25の優れた浮動小数点性能、半精度(FP16) 24.6 TFLOPSまたは単精度(FP32)12.3 TFLOPS、高度な高帯域幅キャッシュ(HBC)およびコントローラと高帯域幅16GB HBM2メモリと組み合わせることで、深い学習で使用されるこれらの複雑なニューラルネットワークを訓練するために、大容量のデータを効率的に処理する今日の厳しいシステム要件を満たすことができる 。世界最先端のメモリアーキテクチャを備えたAMDのNext-Gen「Vega」アーキテクチャをベースにしたMI25アクセラレータは、大量のデータを処理するために最適化されており、前世代に比べて1ワットあたり最大82 GFLOPS FP32ピークGPUの1ワットあたりのFP16または41GFLOPSパフォーマンスと効率が必須のデータインテリジェントなディープラーニングトレーニングの導入では、ワットあたりの優れたパフォーマンスのためにGPUのパフォーマンスが計算されます。
- 比類のないFP16およびFP32浮動小数点パフォーマンス
- HPCクラスラックスケール用オープンソフトウェアROCmプラットフォーム
- 最適化されたMIOpenディープラーニングフレームワークライブラリ
- mGPUピアツーピアの大規模BARサポート
- Epycサーバープロセッサの構成上の利点
- 新しいAMD Epyc™プロセッサーベースのサーバーとRadeon Instinctの "Vega"ベースの製品を組み合わによる、ノードあたりの優れたコンピューティング密度とパフォーマンス
- MxGPU SR-IOVハードウェア仮想化データセンターでの利用率と容量を拡大する
HPC ヘテロジーニアスコンピューティング
HPC業界は毎年膨大な量の非構造化データを作成しており、HPCシステム構成の一部は、コミュニティがそのデータから有用な情報を抽出できるように再構成されています。伝統的に、これらのシステムは主にCPUベースでしたが、データの量と種類が爆発的に増加し、より複雑なコードの進化とともに、これらの従来のシステムは今日のデータ集約型HPCワークロードのすべての要件を満たしていません。これらのタイプのコードがより複雑かつ並列化されるにつれ、ディスクリートGPUおよびFPGAを含むさまざまなアクセラレータのミックスを持つ異種コンピューティングシステムの使用が増加しています。過去10年間のGPU能力の進歩により、深い学習のためにニューラルネットワークをトレーニングするために使用されるもののような、これらの並列コードがますます多く使用されてきました。世界中の科学者や研究者は、現在、加速器を使用して、ライフサイエンス、エネルギー、金融、自動車、航空宇宙、学術、政府、防衛など、いくつかの業界でHPC並列コードをより効率的に処理しています。
AMDの新しい「Zen」ベースのEpycサーバCPUと革新的なROCmオープンソフトウェアプラットフォームを組み合わせたRadeon Instinct MI25は、異種コンピューティングをメタルフォワードから開くための漸進的なアプローチを提供します。AMDの次世代HPCソリューションは、今日の大規模並列データ集約型コードを処理するために必要な効率により、ノードあたりの計算密度とパフォーマンスを最大限に引き出すように設計されています。汎用HPCの展開に強力で柔軟なソリューションを提供することができます。ROCmソフトウェアプラットフォームは、オープンソースのLinuxドライバ、HCCコンパイラ、ツール、およびライブラリを提供するスケーラブルなHPCクラスのソリューションを提供し、科学者と研究者にシステムコントロールを提供します。Radeon Instinctのオープンエコシステムアプローチは、業界標準の相互接続技術とともに、x86、Power8、ARMなどのさまざまなアーキテクチャをサポートしており、HPCコミュニティの科学的進歩へのオープンなアプローチを取り入れた異種コンピューティングの新しい時代に最適なHPCシステムを設計できます。
HPC ヘテロジーニアスコンピューティングの主な利点:
- ノードあたりの優れた計算密度と性能
- HPCクラスラックスケール用オープンソフトウェアROCmプラットフォーム
- メタルフォワードからのオープンソースのLinuxドライバ、HCCコンパイラ、ツール、ライブラリ
- 複数のアーキテクチャおよび業界標準の相互接続テクノロジのオープン業界標準のサポート
製品名 | AMD Radeon INSTINCT MI25 |
型番 | RI-MI25 |
JANコード | 4537694256476 |
GPUアーキテクチャ | AMD "Vega10" |
ストリームプロセッサ | 4,096 |
半精度(FP16) |
24.6 TFLOPS |
単精度(FP32) | 12.3 TFLOPS |
倍精度(FP64) | 768 GFLOPS |
GPUメモリ | 16GB HBM2 |
メモリバンド幅 | 最大484 GB /秒 |
ECC | 〇 |
バスインターフェース | PCI Express Gen 3 × 16 |
MxGPU機能 | 〇 |
ボードフォームファクタ― | フルハイト、デュアルスロット |
ボード長さ | 10.5" |
冷却 | 受動冷却 |
標準最大電力 | 300W TDP |
保証 | 2年間保証 |
サポートOS | Linux 64bit |
プログラミング環境 | ISO C++, OpenCL™, CUDA (via AMD’s HIP conversion tool) Python5 (via Anaconda’s NUMBA) |
製品画像ダウンロード