Arm Allinea Studio は、Arm® ベースのサーバーおよび HPC アプリケーション開発向けに高性能なツールを提供する完全なスイート製品です。Arm® Forge、Arm® C/C++ コンパイラー、Arm® Fortran コンパイラー、Arm® パフォーマンス ライブラリ、および Arm® パフォーマンス レポートが同梱され、Arm®v8-A 上でアプリケーションを実行する際に最適なパフォーマンスを実現します。
Arm のシリコン パートナーと共同開発され、NAG テスト スイートによって検証された Arm® パフォーマンス ライブラリは、Arm®v8-A 上で最適なシリアルおよびパラレル パフォーマンスが発揮できるように設計された商用の 64-bit Armv8 計算ライブラリです。
Arm® パフォーマンス レポートは、あらゆる種類の命令に費やされた時間、メモリ使用量、MPI 通信、およびスレッドの計算や同期に費やされた時間など、幅広いパフォーマンス指標に関する詳細な情報を提供します。
あらゆるプラットフォームやユース ケースにおける高いパフォーマンスを実現することができるように、Arm® C/C++ コンパイラーと Fortran コンパイラーを使用して、C++ 14、LLVM、Flang 等、業界の基盤技術を活用したサーバーおよび HPC コードの開発を支援します。
Arm Forge、Arm® パフォーマンス ライブラリ、および Arm® パフォーマンス レポートを使用して、コードのデバッグ、プロファイリング、最適化を行うことができます。計算速度の向上により、気候や天気、生命科学、製品のシミュレーション、オイルやガスなどの分野における開発を加速します。
Arm Forge は、人気 No.1 の並列デバッガーである Arm DDT と低オーバーヘッドのプロファイラーである Arm MAP を同梱し、Arm®v8-A アーキテクチャ上で稼働するアプリケーションのデバッグ、プロファイリング、および最適化のタスクを簡易化します。
LLVM ベースの Arm® C/C++ コンパイラーは、Arm Forge や Arm® パフォーマンス ライブラリと互換性があり、幅広い Arm® ベースのプラットフォーム上でサーバーや HPC ワークロードを高速化するために、C++ 14 標準をサポートしています。
LLVM および Flang をベースとした、最新の Fortran 標準をサポートする Arm® Fortran コンパイラーは、科学計算や高性能アプリケーション向けに使用されるあらゆる 64-bit の Arm® ハードウェア上で最大のパフォーマンスを引き出すよう設計された商用コンパイラーです。
Arm® C/C++ コンパイラーは、HPC および科学分野向けコードへの対応に加え、最新の C/C++ および OpenMP 標準をサポートし、主要なサーバークラスの Arm® ベース プラットフォーム向けにチューニングされた Linux 環境向けコンパイラーです。オープンソースの Clang フロントエンド、LLVM ベースの最適化とコード生成バックエンドをベースとしています。
Arm® C/C++ コンパイラーによるサポート:
Arm® Fortran コンパイラーは、HPC および科学分野向けコードへの対応に加え、人気の Fortran および OpenMP 標準をサポートし、主要なサーバークラスの Arm® ベース プラットフォーム向けにチューニングされた Linux 環境向けコンパイラーです。PGI オープンソース Flang フロントエンドと、LLVM ベースの最適化とコード生成バックエンドにより構築されています。Fortran アプリケーションを幅広くカバーし、64-bit の Arm®v8-A ベース プラットフォーム上で最適なコードを生成します。
Arm® Fortran コンパイラーによるサポート:
Arm® パフォーマンス ライブラリは、Arm® プロセッサー上の HPC アプリケーション向けに最適化された標準的な計算用のコアライブラリです。NAG スイートで検証されているため、科学計算アプリケーションで使用する際に正確な結果が得られます。また、BLAS、LAPACK、FFT、および標準の数学ルーチンを提供します。マルチコア環境で最大限のパフォーマンスを引き出すため、OpenMP を用いて、多くの BLAS、LAPACK、および FFT ルーチンが構築されています。Fortran および C インターフェイスで使用可能なライブラリ ルーチンには、以下の項目が含まれます。
Arm Forge は、業界最先端のデバッガーである Arm DDT と、すぐに使えるプロファイラーである Arm MAP を組み合わせたスイート製品です。
Arm Forge の詳細は、こちらのページをご参照ください。
Arm® パフォーマンス レポートは、スカラーおよび MPI アプリケーションのパフォーマンスに関する情報をテキストおよび HTML 形式で生成する低オーバーヘッドのツールです。スクリプトに単一のコマンドを追加するだけで、本番向けに最適化されたコードに対する解析を透過的に実行できます。HPC アプリケーションの実行パフォーマンスの特徴を理解するための最も効果的な方法を提供します。
インテル、64-bit Arm、AMD、OpenPOWER、および Nvidia GPU で構成された複数のサーバーや HPC アーキテクチャにおけるコード パフォーマンスを分析し、最新のコンパイラーや C++ 11 標準を用いたソフトウェアの中で改善できる可能性がある箇所をすぐに明らかにします。
Arm Allinea Studio を最大限に活かすには、Arm® C/C++ および Fortran コンパイラーと Arm® パフォーマンス ライブラリにおいて、ハードウェアが最小要件を満たしている必要があります。
Arm® コンパイラーおよびライブラリは、以下の 64-bit Arm のサーバークラス ハードウェアをサポートします。
Marvell ThunderX2 ベースのプラットフォーム |
Huawei Kunpeng 920 ベースのプラットフォーム |
Amazon EC2 A1 インスタンス |
Arm Allinea Studio は、次の Linux ディストリビューションをサポートしています。
Red Hat Enterprise Linux 7.4 以降 |
CentOS 7.4 以降 |
SUSE Linux Enterprise Server 12 および 15 |
Ubuntu 16.04 以降 |
Arm Allinea Studio は、次の MPI をサポートしています。
Open MPI 3.1.2 および 4.0.0 |
Open MPI + OpenUCX 1.5.0 |
MVAPICH2 2.3.1 |
Cray MPT 7.7.6 |
HPE MPI |
Arm® パフォーマンス レポートは、C/C++ および Fortran 言語をサポートします。
ハードウェア アーキテクチャ | オペレーティング システム | MPI | コンパイラー | アクセラレーター |
---|---|---|---|---|
Intel および AMD (x86_64) |
|
|
|
|
Arm (AArch64) |
|
|
|
- |
IBM Power (ppc64 および ppc64le) |
|
|
|
- |
バッチ スケジューラー: SLURM 2.6.3 以降および 14.03 以降 (srun のみ)。
Arm® パフォーマンス レポートを SLURM srun とあわせて使用する場合、SLURM 2.6.3 以降が必要です。
Arm® プロファイリング ライブラリは、静的リンクされたプログラムと明示的にリンクされなければなりません。これは、ほとんどの Cray X シリーズに当てはまります。
14.9 以前のバージョンの PGI コンパイラーでは、静的な Arm® MPI ラッパー ライブラリをコンパイルすることはできません。実行を試みた場合、Error: symbol `MPI_F_MPI_IN_PLACE can not be both weak and common
というメッセージが表示されます。これは、PGI コンパイラーの弱いオブジェクト サポートのバグによるものです。
本エディションには、最適化された Fortran コンパイラー、パフォーマンス ライブラリ、Arm Forge 統合スイートなど、Arm®v8-A アプリケーション開発に必要なものすべてが含まれ、単一ノードおよび単一プロセス向けのデバッグとプロファイリング機能を提供します。
本エディションは、Essential Edition の機能に加え、Arm Forge 統合スイートを介して、単一ノード上で最大 32 プロセスのデバッグとプロファイリング機能を提供します。
本エディションは、HPC Starter Edition の機能に加え、Arm Forge およびデバッグ スイート製品のカスタム メトリックや、最大 4 ノードおよび 64 プロセスの高度なプロファイリング機能を提供します。
機能 | Essential | HPC Starter | HPC Professional |
---|---|---|---|
Arm® C/C++ コンパイラー | |||
Arm® Fortran コンパイラー | |||
Arm® パフォーマンス ライブラリ | |||
Arm® パフォーマンス レポート | |||
Arm Forge (Arm DDT デバッガーおよび Arm MAP プロファイラー同梱) | |||
最大プロセス数 | 1 | 32 MPI プロセス | 64 MPI プロセス |
最大ノード数 | 1 ノード | 1 ノード | 4 ノード |
スケーラブルなデバッグ | |||
スケーラブルなプロファイリング | |||
メモリ デバッグ | |||
CPU、MPI、I/O プロファイリング | |||
ネイティブ リモート クライアント | |||
バージョン管理統合 | |||
CPU ハードウェア カウンター | |||
完全な GPU プロファイリングおよびデバッグ | |||
エネルギー パフォーマンスのメトリック | |||
カスタム メトリック API |
※ 64 を超える MPI プロセスの使用や、4 つ以上の Arm ノードにおける実行とともに HPC アプリケーションのプロファイリングやデバッグを行う場合、Arm Forge および Arm® パフォーマンス レポートを別々に購入する必要があります。