Arm Allinea Studio

サーバークラスの Arm® ベース プラットフォーム上で最高のパフォーマンスを実現するための包括的なツール スイート

コンポーネントEdition 比較


Arm® ベースのサーバーおよび HPC アプリケーション開発を最適化

Arm Allinea Studio は、Arm® ベースのサーバーおよび HPC アプリケーション開発向けに高性能なツールを提供する完全なスイート製品です。Arm® Forge、Arm® C/C++ コンパイラー、Arm® Fortran コンパイラー、Arm® パフォーマンス ライブラリ、および Arm® パフォーマンス レポートが同梱され、最新の Arm®v8-A プロセッサをすべてサポートし、Ubuntu、RHEL、SLES を含むすべての主要な Linux ディストリビューションに対応しています。


 

主な機能

最適化された Arm の計算ライブラリ

Arm のシリコン パートナーと共同開発され、NAG テスト スイートによって検証された Arm® パフォーマンス ライブラリは、Arm®v8-A 上で最適なシリアルおよびパラレル パフォーマンスが発揮できるように設計された商用の 64-bit Armv8 計算ライブラリです。

詳細なパフォーマンス レポート

Arm® パフォーマンス レポートは、あらゆる種類の命令に費やされた時間、メモリ使用量、MPI 通信、およびスレッドの計算や同期に費やされた時間など、幅広いパフォーマンス指標に関する詳細な情報を提供します。

より迅速なコード開発

あらゆるプラットフォームやユース ケースにおける高いパフォーマンスを実現することができるように、Arm® C/C++ コンパイラーと Fortran コンパイラーを使用して、C++ 17、LLVM、Flang 等、業界の基盤技術を活用したサーバーおよび HPC コードの開発を支援します。

より簡単なコード開発

Arm Forge、Arm® パフォーマンス ライブラリ、および Arm® パフォーマンス レポートを使用して、コードのデバッグ、プロファイリング、最適化を行うことができます。計算速度の向上により、気候や天気、生命科学、製品のシミュレーション、オイルやガスなどの分野における開発を加速します。


Arm Allinea Studio を選ぶ理由

完全なツール スイート


Arm Forge は、人気 No.1 の並列デバッガーである Arm DDT と低オーバーヘッドのプロファイラーである Arm MAP を同梱し、Arm®v8-A アーキテクチャ上で稼働するアプリケーションのデバッグ、プロファイリング、および最適化のタスクを簡易化します。

HPC 向けにチューニングされた C/C++ コンパイラー


LLVM ベースの Arm® C/C++ コンパイラーは、Arm Forge や Arm® パフォーマンス ライブラリと互換性があり、幅広い Arm® ベースのプラットフォーム上でサーバーや HPC ワークロードを高速化するために、C++ 17 をサポートしています。

高性能な Fortran コンパイラー


LLVM および Flang をベースとした、最新の Fortran 標準をサポートする Arm® Fortran コンパイラーは、科学計算や高性能アプリケーション向けに使用されるあらゆる 64-bit の Arm® ハードウェア上で最大のパフォーマンスを引き出すよう設計された商用コンパイラーです。


コンポーネント

Arm Allinea Studio に含まれるもの:

  1. Arm® C/C++ コンパイラー

    Arm® C/C++ コンパイラーは、HPC および科学分野向けコードへの対応に加え、最新の C/C++ および OpenMP 標準をサポートし、主要なサーバークラスの Arm® ベース プラットフォーム向けにチューニングされた Linux 環境向けコンパイラーです。オープンソースの Clang フロントエンド、LLVM ベースの最適化とコード生成バックエンドをベースとしています。

    Arm® C/C++ コンパイラーによるサポート:

    • C++ 17 標準またはそれ以前
    • モダン C 17 標準またはそれ以前
    • OpenMP 4.5 標準またはそれ以前
    • Marvell ThunderX2、Fujitsu A64FX、Arm Neoverse-N1 (Amazon Graviton 2、Ampere Altra を含む) 等、サーバークラスの Arm® プラットフォーム
    • HPC 向けの Arm® アーキテクチャ拡張である SVE および SVE2
    • RHEL、SLES、および Ubuntu を含む主要な Linux ディストリビューション
  2. Arm® Fortran コンパイラー

    Arm® Fortran コンパイラーは、HPC および科学分野向けコードへの対応に加え、人気の Fortran および OpenMP 標準をサポートし、主要なサーバークラスの Arm® ベース プラットフォーム向けにチューニングされた Linux 環境向けコンパイラーです。PGI オープンソース Flang フロントエンドと、LLVM ベースの最適化とコード生成バックエンドにより構築されています。Fortran アプリケーションを幅広くカバーし、64-bit の Arm®v8-A ベース プラットフォーム上で最適なコードを生成します。

    Arm® Fortran コンパイラーによるサポート:

    • 最新の Fortran 2008 標準またはそれ以前
    • OpenMP 4.5 標準またはそれ以前
    • Marvell ThunderX2、Fujitsu A64FX、Arm Neoverse-N1 (Amazon Graviton 2、Ampere Altra を含む) 等、サーバークラスの Arm® プラットフォーム
    • HPC 向けの Arm® アーキテクチャ拡張である SVE および SVE2
    • RHEL、SLES、および Ubuntu を含む主要な Linux ディストリビューション
  3. Arm® パフォーマンス ライブラリ

    Arm® パフォーマンス ライブラリは、Arm® プロセッサー上の HPC アプリケーション向けに最適化された標準的な計算用のコアライブラリです。NAG スイートで検証されているため、科学計算アプリケーションで使用する際に正確な結果が得られます。また、BLAS、LAPACK、FFT、疎行列、Libastring、および標準の数学ルーチンを提供します。マルチコア環境で最大限のパフォーマンスを引き出すため、OpenMP を用いて、多くの BLAS、LAPACK、および FFT ルーチンが構築されています。Fortran および C インターフェイスで使用可能なライブラリ ルーチンには、以下の項目が含まれます。

    • BLAS - XBLAS や拡張精度 BLAS を含む基本線形代数サブプログラム (Basic Linear Algebra Subprograms)。
    • LAPACK 3.9.0 - 高レベル線形代数ルーチンの包括的なパッケージ。
    • FFT - 実数および複素数データ用の一連の高速フーリエ変換ルーチン。
    • 疎行列
    • 数学ルーチン - 最適化された exp、exp2、log ルーチン(log、log2、log10)、誤差関数 (erf、erfc)、sinf、cosf および sincosf。
    • Libastring - libastring は、AArch64 用に最適化された一連の置換 string.h 関数を提供します (bcmp、memchr、memcpy、memmove、memset、strchr、strchrnul、strcmpstrcpy、strlen、strncmp、strnlen)。libc の前に libastring にリンクすると、これらの最適化された関数を確実に使用できます。
  4. Arm Forge

    Arm Forge は、業界最先端のデバッガーである Arm DDT と、すぐに使えるプロファイラーである Arm MAP を組み合わせたスイート製品です。

    Arm Forge の詳細は、こちらのページをご参照ください。

  5. Arm® パフォーマンス レポート

    Arm® パフォーマンス レポートは、スカラーおよび MPI アプリケーションのパフォーマンスに関する情報をテキストおよび HTML 形式で生成する低オーバーヘッドのツールです。スクリプトに単一のコマンドを追加するだけで、本番向けに最適化されたコードに対する解析を透過的に実行できます。HPC アプリケーションの実行パフォーマンスの特徴を理解するための最も効果的な方法を提供します。

    インテル、64-bit Arm、AMD、OpenPOWER、および Nvidia GPU で構成された複数のサーバーや HPC アーキテクチャにおけるコード パフォーマンスを分析し、最新のコンパイラーや C++ 11 標準を用いたソフトウェアの中で改善できる可能性がある箇所をすぐに明らかにします。

     
    • より速い命令実行:
      メモリ アクセス、数値演算、浮動小数点演算など、さまざまな種類の命令に費やされた時間を簡単に識別できます。
    • I/O ボトルネックの軽減:
      ストレージに対する読み書き操作の時間と有効なパフォーマンス (転送速度) をすばやく決定します。
    • スレッド計算の改善:
      計算と同期に費やされた時間、物理的なコア使用率、およびシステム負荷を確認します。
    • より速いメッセージの受け渡し:
      一括およびポイントツーポイント操作のために、MPI に費やされる時間とパフォーマンスに関する正確な洞察を取得できます。
    • 電力効率の改善:
      システム、CPU、およびあらゆる NVIDIA GPU の効率を向上するための、エネルギー使用量およびピーク時の電力に関する貴重な理解を深めます。
    • より効率的な加速:
      NVIDIA GPU の正確な使用率とメモリ使用量を視覚化します。
    • より効率的なメモリ使用量:
      ノードごとの平均メモリ使用量を一見で特定し、メモリ使用量を向上できます。

Arm® コンパイラーおよびライブラリのシステム要件

Arm Allinea Studio を最大限に活かすには、Arm® C/C++ および Fortran コンパイラーと Arm® パフォーマンス ライブラリにおいて、ハードウェアが最小要件を満たしている必要があります。

ハードウェア要件

Arm® コンパイラーおよびライブラリは、以下の 64-bit Arm のサーバークラス ハードウェアをサポートします。

Fujitsu A64FX ベースのプラットフォーム
Marvell ThunderX2 ベースのプラットフォーム
Amazon EC2 A1 インスタンスAmpere Altra などの Neoverse N1 ベースのプラットフォーム
Neoverse N2 ベースのプラットフォーム
Neoverse V1 ベースのプラットフォーム

Linux ディストリビューション

Arm Allinea Studio は、次の Linux ディストリビューションをサポートしています。

Red Hat Enterprise Linux 7.x および 8.x
CentOS 7.x および 8.x
SUSE Linux Enterprise Server 15
Ubuntu 18.04 および 20.04

Environment Module システム

Modules
Lmod

MPI

Arm Allinea Studio は、次の MPI をサポートしています。

Open MPI
Open MPI + OpenUCX
MVAPICH
Cray MPT
HPE MPI


Arm パフォーマンス レポートのシステム要件

Arm® パフォーマンス レポートは、C/C++ および Fortran 言語をサポートします。

ハードウェア アーキテクチャ オペレーティング システム MPI コンパイラー アクセラレーター
Intel および AMD (x86_64)
  • Red Hat Enterprise Linux/CentOS 7 および 8
  • SuSE Linux Enterprise 12、および 15
  • Ubuntu 16.04、および 20.04
  • Open MPI 3 から 4
  • MPICH
  • MVAPICH2
  • Intel MPI
  • Cray MPT
  • HPE MPI
  • GNU C/C++/Fortran Compiler
  • Intel Parallel Studio
  • Cray Compiling Environment
  • NVIDIA HPC (PGI) Compiler
  • Nvidia CUDA Toolkit 9.0 から 11.1
Armv8 (AArch64)
  • Red Hat Enterprise Linux/CentOS 7 および 8
  • SuSE Linux Enterprise 12 および 15
  • Ubuntu 16.04 から 20.04
  • Open MPI 3 から 4
  • MPICH
  • MVAPICH2
  • Cray MPT
  • HPE MPI
  • GNU C/C++/Fortran Compiler
  • Cray Compiling Environment
  • Arm Compiler for Linux
  • NVIDIA HPC (PGI) Compiler
  • Nvidia CUDA Toolkit 11.0 から 11.1
IBM Power (ppc64le)
  • Red Hat Enterprise Linux/CentOS 7 および 8
  • Open MPI 3 から 4
  • IBM Spectrum MPI
  • GNU C/C++/Fortran Compiler
  • IBM XL Compiler
  • NVIDIA HPC (PGI) Compiler
  • Nvidia CUDA Toolkit 9.2 から 11.1

以下の MPI は、Arm 社の事前コンパイル済みのラッパーでもサポートされています。

  • Open MPI 3.x.x から 4.0.x
  • Intel MPI 5.x.x、2017.x、2018.x および 2019.x
  • Cray MPT
  • MVAPICH 2.x.x

その他の MPI は、実行時に作成されます。

Arm Forge プロファイラ ライブラリは、静的にリンクされたプログラムとリンクする必要があります。これは主に Cray X-Series に適用されます。


Arm Forge のシステム要件は、こちらのページにてご確認ください。

Edition 比較

Essential Edition

本エディションには、最適化された Fortran コンパイラー、パフォーマンス ライブラリ、Arm Forge 統合スイートなど、Arm®v8-A アプリケーション開発に必要なものすべてが含まれ、単一ノードおよび単一プロセス向けのデバッグとプロファイリング機能を提供します。


HPC Starter Edition

本エディションは、Essential Edition の機能に加え、Arm Forge 統合スイートを介して、単一ノード上で最大 32 プロセスのデバッグとプロファイリング機能を提供します。


HPC Professional Edition

本エディションは、HPC Starter Edition の機能に加え、Arm Forge およびデバッグ スイート製品のカスタム メトリックや、最大 4 ノードおよび 64 プロセスの高度なプロファイリング機能を提供します。



Edition 間における機能比較表

機能 Essential HPC Starter HPC Professional
Arm® C/C++ コンパイラー check check check
Arm® Fortran コンパイラー check check check
Arm® パフォーマンス ライブラリ check check check
Arm® パフォーマンス レポート check check check
Arm Forge (Arm DDT デバッガーおよび Arm MAP プロファイラー同梱)
最大プロセス数 1 32 MPI プロセス 64 MPI プロセス
最大ノード数 1 ノード 1 ノード 4 ノード

※ 64 を超える MPI プロセスの使用や、4 つ以上の Arm ノードにおける実行とともに HPC アプリケーションのプロファイリングやデバッグを行う場合、Arm Forge および Arm® パフォーマンス レポートを別々に購入する必要があります。

 

ライセンス体系、価格、お見積り依頼、ご購入前の技術的なお問い合わせなど、本製品に関するご質問、ご不明な点はお気軽にお問い合わせください。

お問い合わせ

 

ページトップへ