Arm Allinea Studio

サーバークラスの Arm® ベース プラットフォーム上で最高のパフォーマンスを実現するための包括的なツール スイート

コンポーネントEdition 比較


Arm® ベースのサーバーおよび HPC アプリケーション開発を最適化

Arm Allinea Studio は、Arm® ベースのサーバーおよび HPC アプリケーション開発向けに高性能なツールを提供する完全なスイート製品です。Arm® Forge、Arm® C/C++ コンパイラー、Arm® Fortran コンパイラー、Arm® パフォーマンス ライブラリ、および Arm® パフォーマンス レポートが同梱され、Arm®v8-A 上でアプリケーションを実行する際に最適なパフォーマンスを実現します。


 

主な機能

最適化された Arm の計算ライブラリ

Arm のシリコン パートナーと共同開発され、NAG テスト スイートによって検証された Arm® パフォーマンス ライブラリは、Arm®v8-A 上で最適なシリアルおよびパラレル パフォーマンスが発揮できるように設計された商用の 64-bit Armv8 計算ライブラリです。

詳細なパフォーマンス レポート

Arm® パフォーマンス レポートは、あらゆる種類の命令に費やされた時間、メモリ使用量、MPI 通信、およびスレッドの計算や同期に費やされた時間など、幅広いパフォーマンス指標に関する詳細な情報を提供します。

より迅速なコード開発

あらゆるプラットフォームやユース ケースにおける高いパフォーマンスを実現することができるように、Arm® C/C++ コンパイラーと Fortran コンパイラーを使用して、C++ 14、LLVM、Flang 等、業界の基盤技術を活用したサーバーおよび HPC コードの開発を支援します。

より簡単なコード開発

Arm Forge、Arm® パフォーマンス ライブラリ、および Arm® パフォーマンス レポートを使用して、コードのデバッグ、プロファイリング、最適化を行うことができます。計算速度の向上により、気候や天気、生命科学、製品のシミュレーション、オイルやガスなどの分野における開発を加速します。


Arm Allinea Studio を選ぶ理由

完全なツール スイート


Arm Forge は、人気 No.1 の並列デバッガーである Arm DDT と低オーバーヘッドのプロファイラーである Arm MAP を同梱し、Arm®v8-A アーキテクチャ上で稼働するアプリケーションのデバッグ、プロファイリング、および最適化のタスクを簡易化します。

HPC 向けにチューニングされた C/C++ コンパイラー


LLVM ベースの Arm® C/C++ コンパイラーは、Arm Forge や Arm® パフォーマンス ライブラリと互換性があり、幅広い Arm® ベースのプラットフォーム上でサーバーや HPC ワークロードを高速化するために、C++ 14 標準をサポートしています。

高性能な Fortran コンパイラー


LLVM および Flang をベースとした、最新の Fortran 標準をサポートする Arm® Fortran コンパイラーは、科学計算や高性能アプリケーション向けに使用されるあらゆる 64-bit の Arm® ハードウェア上で最大のパフォーマンスを引き出すよう設計された商用コンパイラーです。


コンポーネント

Arm Allinea Studio に含まれるもの:

  1. Arm® C/C++ コンパイラー

    Arm® C/C++ コンパイラーは、HPC および科学分野向けコードへの対応に加え、最新の C/C++ および OpenMP 標準をサポートし、主要なサーバークラスの Arm® ベース プラットフォーム向けにチューニングされた Linux 環境向けコンパイラーです。オープンソースの Clang フロントエンド、LLVM ベースの最適化とコード生成バックエンドをベースとしています。

    Arm® C/C++ コンパイラーによるサポート:

    • C++ 14 標準またはそれ以前
    • OpenMP 4.5* (オフロードはサポートしていません)
    • Cavium ThunderX2 や Qualcomm Centriq を含む 64-bit Arm® プラットフォーム
    • HPC 向けの Arm® アーキテクチャ拡張である SVE
    • Red Hat 7.3 以降、SLES 12 以降、および Ubuntu 16.04 以降を含む主要な Linux ディストリビューション
  2. Arm® Fortran コンパイラー

    Arm® Fortran コンパイラーは、HPC および科学分野向けコードへの対応に加え、人気の Fortran および OpenMP 標準をサポートし、主要なサーバークラスの Arm® ベース プラットフォーム向けにチューニングされた Linux 環境向けコンパイラーです。PGI オープンソース Flang フロントエンドと、LLVM ベースの最適化とコード生成バックエンドにより構築されています。Fortran アプリケーションを幅広くカバーし、64-bit の Arm®v8-A ベース プラットフォーム上で最適なコードを生成します。

    Arm® Fortran コンパイラーによるサポート:

    • Fortran 2003 標準またはそれ以前
    • Fortran 2008 に対する部分的なサポート
    • OpenMP 3.1
    • Cavium ThunderX2 や Qualcomm Centriq を含む 64-bit Arm® プラットフォーム
    • HPC 向けの Arm® アーキテクチャ拡張である SVE
    • Red Hat 7.3 以降、SLES 12 以降、および Ubuntu 16.04 以降を含む主要な Linux ディストリビューション
  3. Arm® パフォーマンス ライブラリ

    Arm® パフォーマンス ライブラリは、Arm® プロセッサー上の HPC アプリケーション向けに最適化された標準的な計算用のコアライブラリです。NAG スイートで検証されているため、科学計算アプリケーションで使用する際に正確な結果が得られます。また、BLAS、LAPACK、FFT、および標準の数学ルーチンを提供します。マルチコア環境で最大限のパフォーマンスを引き出すため、OpenMP を用いて、多くの BLAS、LAPACK、および FFT ルーチンが構築されています。Fortran および C インターフェイスで使用可能なライブラリ ルーチンには、以下の項目が含まれます。

    • BLAS - XBLAS や拡張精度 BLAS を含む基本線形代数サブプログラム (Basic Linear Algebra Subprograms)。
    • LAPACK - 高レベル線形代数ルーチンの包括的なパッケージ。
    • FFT - 実数および複素数データ用の一連の高速フーリエ変換ルーチン。
    • 数学ルーチン - 最適化された exp、pow、および log ルーチン。
  4. Arm Forge

    Arm Forge は、業界最先端のデバッガーである Arm DDT と、すぐに使えるプロファイラーである Arm MAP を組み合わせたスイート製品です。

    Arm Forge の詳細は、こちらのページをご参照ください。

  5. Arm® パフォーマンス レポート

    Arm® パフォーマンス レポートは、スカラーおよび MPI アプリケーションのパフォーマンスに関する情報をテキストおよび HTML 形式で生成する低オーバーヘッドのツールです。スクリプトに単一のコマンドを追加するだけで、本番向けに最適化されたコードに対する解析を透過的に実行できます。HPC アプリケーションの実行パフォーマンスの特徴を理解するための最も効果的な方法を提供します。

    インテル、64-bit Arm、AMD、OpenPOWER、および Nvidia GPU で構成された複数のサーバーや HPC アーキテクチャにおけるコード パフォーマンスを分析し、最新のコンパイラーや C++ 11 標準を用いたソフトウェアの中で改善できる可能性がある箇所をすぐに明らかにします。

     
    • より速い命令実行:
      メモリ アクセス、数値演算、浮動小数点演算など、さまざまな種類の命令に費やされた時間を簡単に識別できます。
    • I/O ボトルネックの軽減:
      ストレージに対する読み書き操作の時間と有効なパフォーマンス (転送速度) をすばやく決定します。
    • スレッド計算の改善:
      計算と同期に費やされた時間、物理的なコア使用率、およびシステム負荷を確認します。
    • より速いメッセージの受け渡し:
      一括およびポイントツーポイント操作のために、MPI に費やされる時間とパフォーマンスに関する正確な洞察を取得できます。
    • 電力効率の改善:
      システム、CPU、およびあらゆる NVIDIA GPU の効率を向上するための、エネルギー使用量およびピーク時の電力に関する貴重な理解を深めます。
    • より効率的な加速:
      NVIDIA GPU の正確な使用率とメモリ使用量を視覚化します。
    • より効率的なメモリ使用量:
      ノードごとの平均メモリ使用量を一見で特定し、メモリ使用量を向上できます。

Arm® コンパイラーおよびライブラリのシステム要件

Arm Allinea Studio を最大限に活かすには、Arm® C/C++ および Fortran コンパイラーと Arm® パフォーマンス ライブラリにおいて、ハードウェアが最小要件を満たしている必要があります。

ハードウェア要件

Arm® コンパイラーおよびライブラリは、以下の 64-bit Arm のサーバークラス ハードウェアをサポートします。

Marvell ThunderX2 ベースのプラットフォーム
Huawei Kunpeng 920 ベースのプラットフォーム
Amazon EC2 A1 インスタンス

Linux ディストリビューション

Arm Allinea Studio は、次の Linux ディストリビューションをサポートしています。

Red Hat Enterprise Linux 7.4 以降
CentOS 7.4 以降
SUSE Linux Enterprise Server 12 および 15
Ubuntu 16.04 以降

MPI

Arm Allinea Studio は、次の MPI をサポートしています。

Open MPI 3.1.2 および 4.0.0
Open MPI + OpenUCX 1.5.0
MVAPICH2 2.3.1
Cray MPT 7.7.6
HPE MPI


Arm パフォーマンス レポートのシステム要件

Arm® パフォーマンス レポートは、C/C++ および Fortran 言語をサポートします。

ハードウェア アーキテクチャ オペレーティング システム MPI コンパイラー アクセラレーター
Intel および AMD (x86_64)
  • Red Hat Enterprise Linux/CentOS 6 および 7
  • SuSE Linux Enterprise 11、12、および 15
  • Ubuntu 14.04、16.04、および 18.04
  • Open SuSE 12、13、42.3、および 15.0
  • Open MPI 1.8、1.10、2.0、2.1、3.0、および 3.1
  • MPICH 3.1 から 3.2
  • MVAPICH2 2.0 から 2.3
  • Intel MPI 5.1.x から 2018.3
  • Cray MPT 6.3.1 から 7.7.1
  • SGI MPT 2.10 から 2.15
  • HPE MPI 1.1
  • IBM Platform MPI 9.1.x
  • Bullx MPI 1.2.7.x から 1.2.9.x
  • GNU C/C++/Fortran Compiler 4.3.x から 8.1.x
  • LLVM Clang 3.3 から 6.0
  • Intel Parallel Studio XE 2013.x から 2018.3
  • PGI Compiler 14.0 から 18.7
  • Cray Compiling Environment 8.3.x から 8.7.x
  • Nvidia CUDA Compiler 7.0 から 9.2
  • Nvidia CUDA Toolkit 7.0 から 9.2
Arm (AArch64)
  • Red Hat Enterprise Linux/CentOS 7
  • SuSE Linux Enterprise 12
  • Ubuntu 16.04
  • Open MPI 1.8、1.10、2.0、2.1、3.0、および 3.1
  • MPICH 3.1 から 3.2
  • MVAPICH2 2.0 から 2.3
  • Cray MPT 7.7.1
  • HPE MPI 1.1
  • Bullx MPI 1.2.7.x から 1.2.9.x
  • GNU C/C++/Fortran Compiler 4.3.x から 8.1.x
  • LLVM Clang 3.3 から 6.0
  • Arm C/C++/Fortran Compiler 18.0 から 18.3
  • Cray Compiling Environment 8.7.x
 -
IBM Power (ppc64 および ppc64le)
  • Red Hat Enterprise Linux/CentOS 7
  • Open MPI 1.8、1.10、2.0、2.1、3.0、および 3.1
  • IBM Spectrum MPI 10.2
  • GNU C/C++/Fortran Compiler 4.3.x から 8.1.x
  • IBM XL C/C++ Compiler 13.1.x
  • IBM XL Fortran Compiler 15.1.x
  • IBM XL Compiler 16.1
  • PGI Compiler 18.1、18.5、および 18.7
 -

バッチ スケジューラー: SLURM 2.6.3 以降および 14.03 以降 (srun のみ)。

Arm® パフォーマンス レポートを SLURM srun とあわせて使用する場合、SLURM 2.6.3 以降が必要です。

Arm® プロファイリング ライブラリは、静的リンクされたプログラムと明示的にリンクされなければなりません。これは、ほとんどの Cray X シリーズに当てはまります。

14.9 以前のバージョンの PGI コンパイラーでは、静的な Arm® MPI ラッパー ライブラリをコンパイルすることはできません。実行を試みた場合、Error: symbol `MPI_F_MPI_IN_PLACE can not be both weak and common というメッセージが表示されます。これは、PGI コンパイラーの弱いオブジェクト サポートのバグによるものです。


Arm Forge のシステム要件は、こちらのページにてご確認ください。

Edition 比較

Essential Edition

本エディションには、最適化された Fortran コンパイラー、パフォーマンス ライブラリ、Arm Forge 統合スイートなど、Arm®v8-A アプリケーション開発に必要なものすべてが含まれ、単一ノードおよび単一プロセス向けのデバッグとプロファイリング機能を提供します。


HPC Starter Edition

本エディションは、Essential Edition の機能に加え、Arm Forge 統合スイートを介して、単一ノード上で最大 32 プロセスのデバッグとプロファイリング機能を提供します。


HPC Professional Edition

本エディションは、HPC Starter Edition の機能に加え、Arm Forge およびデバッグ スイート製品のカスタム メトリックや、最大 4 ノードおよび 64 プロセスの高度なプロファイリング機能を提供します。



Edition 間における機能比較表

機能 Essential HPC Starter HPC Professional
Arm® C/C++ コンパイラー check check check
Arm® Fortran コンパイラー check check check
Arm® パフォーマンス ライブラリ check check check
Arm® パフォーマンス レポート check check check
Arm Forge (Arm DDT デバッガーおよび Arm MAP プロファイラー同梱)
最大プロセス数 1 32 MPI プロセス 64 MPI プロセス
最大ノード数 1 ノード 1 ノード 4 ノード
スケーラブルなデバッグ check check check
スケーラブルなプロファイリング check check check
メモリ デバッグ check check check
CPU、MPI、I/O プロファイリング check check check
ネイティブ リモート クライアント check check check
バージョン管理統合 check check check
CPU ハードウェア カウンター check
完全な GPU プロファイリングおよびデバッグ check
エネルギー パフォーマンスのメトリック check
カスタム メトリック API check

※ 64 を超える MPI プロセスの使用や、4 つ以上の Arm ノードにおける実行とともに HPC アプリケーションのプロファイリングやデバッグを行う場合、Arm Forge および Arm® パフォーマンス レポートを別々に購入する必要があります。

 

ライセンス体系、価格、お見積り依頼、ご購入前の技術的なお問い合わせなど、本製品に関するご質問、ご不明な点はお気軽にお問い合わせください。

お問い合わせ

 

ページトップへ