評価版ダウンロード
お問い合わせ
製品のご購入
価格
ライセンスについて
バージョンアップ
購入方法
製品の登録
技術情報
導入事例
トレーニング
FAQ
ドキュメント
最新情報

インテル ソフトウェア開発製品最新情報» 詳細

インテル コンパイラー 11.1 英語版をリリースしました» 詳細

インテル ソフトウェア開発製品に関する書籍をご紹介します» 詳細

コンパイラを変えるだけでパフォーマンスが向上!?関連記事をご紹介します» 詳細

トレース アナライザー/コレクター

インテル® プロセッサーベースのクラスターでパフォーマンスを向上

インテル® プロセッサー・ベースのクラスター上で、ハイパフォーマンスなアプリケーションの解析、最適化、配備を行います。インテル® トレース・アナライザー/コレクターは、MPI 通信によるパフォーマンスのボトルネックを素早く発見することで、MPI クラスターのパフォーマンスを理解および最適化するための重要な情報を提供します。バージョン 7.2 には、トレースファイルの比較機能とカウンターデータの表示機能、およびMPI 正当性検証ライブラリーが新たに含まれています。


特長

  • MPI やその他のアプリケーション実行時のイベントトレースをグラフィカルに表示し、手軽に分析するためのツールを提供します。任意のレベルの詳細情報にすばやくアクセスできるため、パフォーマンス上の hotspot やボトルネックを容易に特定できます。

  • スケーラブルな表示機能によって、クラスタ、ノード、プロセスなどさまざまな抽象化レベルでトレースデータを表示します。

  • アプリケーション実行時の動作に関する重要なデータをミクロレベルおよびマクロレベルで表示します。


新着ドキュメントをご覧ください。

機能と利点
MPI パフォーマンスの解析、並列アプリケーション実行のスピードアップ、hotspot とボトルネックの特定、詳細な解析とアラインされたタイムラインのグラフィック表示でトレースファイルの比較を行います。
インテル® TAC 7.2 の利点

Linux および Microsoft Windows (Windows Compute Cluster Server 2003、Windows XP および Windows Server 2003) でのサポート

多くのドリルダウン表示オプションを備えた、直感的でフルカラーのカスタマイズ可能 GUI

低オーバーヘッドで効率的なメモリー使用により高度にスケーラブル

簡単なランタイムロード - MPI アプリケーション実行ファイルのインストルメント

MPI 正当性検証ライブラリーにより、通信における多くの種類のエラーを検出

統合されたオンラインヘルプ

簡単なインストールと詳細なドキュメント

フルトレース/軽量な統計収集

新機能

インテル® トレース・アナライザー GUI で正当性検証レポートが利用可能に!

Trolltech Qt 4.x への移行で一新したルックアンドフィール

追加サポート:
-

インテル® コンパイラー 11.0

-

Microsoft Windows Vista と HPC Server 2008

多機能、さまざまなオプション、大幅なパフォーマンス向上

PIN ベースのバイナリー・インストルメンテーション

関数、プロセス、スレッド、タイムライン、またはクラスターやノード別に表示される実行時の動作

複数のフィルタタイプ (関数、プロセス、メッセージ) と集計

パフォーマンス・カウンター・データ記録のタイムラインでの表示

ランタイム・オーバーヘッドとメモリー消費を抑えるためのトレースデータのキャッシュ

非 MPI アプリケーションに対するイベントベースのトレース用にマルチスレッド MPI アプリケーションをトレース

フェイルセーフ・トレース機能

MPI-1、SHMEM、MPI-IO、ROMIO のサポート

MPI 正当性検証ライブラリー (Linux) による分散メモリー確認機能

トレースコレクター

自動 MPI トレース機能と MPI 正当性検証機能

汎用的な分散 (非 MPI) およびシングル・プロセス・トレース機能

アプリケーションがクラッシュした場合でも作成されるトレースでのスレッドレベル・トレース機能

HPM データ収集 (PAPI、rusage、OS カウンター)

設定可能なトレースファイル・パラメーター

機能の無効化/有効化

チューニング・パラメーター

Valgrind による分散メモリー確認機能

バイナリー・ランタイム・インストルメンテーション

コンパイラー・インストルメンテーション
 

1. Icc/ifort/icpc -tcollect

 

2. Gcc/g++ -finstrument-functions

API: ソースコード・インストルメンテーション (カウンター、関数、メッセージと集合操作を記録)

トレース・アナライザー

イベント・タイムライン、質的タイムライン、量的タイムライン、カウンター・タイムライン

柔軟なメッセージと集合操作プロファイル

関数プロファイル (コールグラフ、コールツリー、フラットバランスとロードバランス)

詳細比較 (2 トレース)

フルテキスト・ブラウザーによるマルチレベルのソースコードの視覚化

柔軟で強力なイベントのタグ付けとフィルタリング

関数またはプロセスデータの階層型グループ分けと集計

チャートごとの設定パラメーター・セット

テキストでのプロファイリング・データのエクスポート、グラフィックまたはプリンターへのチャートのエクスポート

コマンドライン・インターフェイス

MPI 検証

インテル® トレース・アナライザー/コレクターに含まれる特殊な MPI 正当性検証機能によって、デッドロック、データ破損、または MPI パラメーター、データ型、バッファー、コミュニケーター、PTP メッセージと集合操作のエラーを検出します。実行時の確認機能、検出時のエラー報告などにより、デバッグプロセスの迅速な処理が可能です。正当性検証機能ではまた、小さなフットプリントで、デバッガーのブレークポイントをインプレース解析に役立たせることができます。

トレース・アナライザー/コレクターの正当性検証機能の真価は、非常に大規模なシステムにスケーリングできる潜在能力と、多数のプロセス間でもエラーを検出できる能力にあります。検証機能は、プロファイル (特定の実装) に基づいて動作するように設定でき、ファブリックの種類を問わずデッドロックを表示できます。

データ型をトラックし、MPI 呼び出しをラッピングすることにより、リクエストとコミュニケーターをトレースコレクターで再利用することができます。(検証ライブラリーはパフォーマンス・データ収集ライブラリーのソースコードからコンパイルされます。)アナライザーは、非常に迅速にコールスタックをアンワインドし、デバッグ情報を使用して、フレームポインターあり/なしで命令アドレスをソースコードにマップします。

コマンドライン・インターフェイスおよび GUI インターフェイスの両方で、ユーザーはバッチのセットアップやインタラクティブなデバッギングを追加で行うことができます。タイムライン・ビューは、実際の関数呼び出し、およびプロセスの相互作用を表示し、誤った実行順が原因の大幅な遅延やエラーを強調します。

インストルメンテーションとトレース

インテル® トレース・アナライザー/コレクターは、影響の少ないバイナリー・インストルメンテーションに特化しています。静的および動的にリンクされた既存のバイナリー実行形式にこのインストルメンテーションを作成して追加することができ、MPI および関数の入口/出口ポイントを自動的にモニターすることができます。これには、C、C++、Fortran の並列スレッドにおけるパフォーマンス・データのトレース機能と記録機能も含まれます。

インテル® トレース・アナライザー/コレクターは、C、C++、Fortran を使用する MPI アプリケーションと分散型非 MPI アプリケーションの両方をサポートしています。インテル® MPI ライブラリーと動作するアプリケーションの場合、内部 MPI ステートのトレースもサポートされます。

インターフェイスと表示機能

タイムライン・ビューと並列ビュー

並列アプリケーションの並行した動作を表示

時間軸に沿ってアプリケーションのアクティビティー、イベント・ソース・コードの場所、メッセージパッシングを表示 (図 1 を参照)


図 1. タイムライン・ビューと並列ビュー

高度な GUI

高速なインターフェイスで表示と統計を管理

詳細を表示するオブジェクトのポイント・アンド・ズーム、状況依存サブメニュー

対になった表示で重点的な解析が可能

再計算された統計を自動的に更新

並列実行の特定の段階における関数グループと通信のタイムライン表示、コールグラフ、パフォーマンス・プロファイルを提供

スケーラブルな表示機能

トレースデータの抽象レベルによって移動: クラスター、ノード、プロセス、スレッド、関数階層 (クラス)

ミクロレベルおよびマクロレベルの表示

アプリケーション・ランタイムの動作を関数別やプロセス別に詳細表示

費やされた時間量を簡単に識別 (MPI 通信など)

2 つのプログラム実行間のパフォーマンスの違いを簡単に確認 (図 2 を参照)


図 2. 2 つのトレースファイルを比較する新しい比較表示

使いやすさ

ユーザーイベントを制御または記録できるユーザーフレンドリーなアプリケーション・プログラミング・インターフェイス (API) を提供

多目的に使用できる記録機能とカウンターデータの解析を追加 (図 3 を参照)


図 3. 新しいカウンター・タイムライン表示

メトリクス・トラッキング

通信統計

並列アプリケーションの通信パターンを表示

任意の時間間隔のメトリクスを表示

比較を通してアルゴリズムの変更によるパフォーマンスの変化を追跡

図 4 は、通信オーバーヘッド (赤) とともに同じアルゴリズムの同期通信 (左) と非同期通信 (右) を示しています。


図 4. 同期通信と非同期通信

実行統計

コールツリー特性レベルまで掘り下げたサブルーチン実行メトリクスを提供

バイナリー、コンパイラー駆動、およびソースコード・インストルメンテーションにより、MPI を超える非常に詳細な解析を提供

プロファイリング・ライブラリー

分散型イベントベースのトレースデータを記録

統計の可読性

アプリケーション・ランタイムの動作を関数別やプロセス別に詳細表示 関数呼び出し、メッセージ送信、集合演算の情報を記録

動作環境

ハードウェア
最小要件

IA-32、インテル® 64、または IA-64 (旧称: Itanium) アーキテクチャー・ベース・システム。該当するインテル® プロセッサーの例:

インテル® Pentium® 4 プロセッサー、または
インテル® Xeon® プロセッサー、または
インテル® Itanium® プロセッサー、または
インテル® Core™2 Duo プロセッサー (インテル® 64 アーキテクチャーの例)

同種のプロセッサーを使用したホモジニアスなクラスターシステムが想定されていることに注意してください。

4GB RAM (8GB RAM 推奨)

1GB のディスク空き容量 (10GB 推奨)


オペレーティング・システム・サポート

全 3 アーキテクチャー

Red Hat Enterprise Linux 4.0、5.0

SUSE Linux Enterprise Server (SLES) 9、10

IA-32 およびインテル® 64 アーキテクチャー

Microsoft Windows Vista

インテル® 64 および IA 64 アーキテクチャー

SGI ProPack 5

IA-32 アーキテクチャーのみ Microsoft Windows XP
インテル® 64 アーキテクチャーのみ

Red Hat Fedora Core 7 から 8

cAos 2

CentOS 4.6、5.1

openSuSE Linux 10.3

Microsoft Windows Compute Cluster Server 2003

Microsoft Windows Server 2003

Microsoft Windows XP Professional x64 Edition

Microsoft Windows HPC Server 2008

Microsoft Windows Server 2008


その他の対応ソフトウェア
インテル® MPI ライブラリーまたは MPICH
インテル® MPI ベンチマーク
インテル® マス・カーネル・ライブラリー
インテル® C++ コンパイラー
インテル® Fortran コンパイラー
GNU C、C++、FORTRAN77 コンパイラー
SGI Message Passing Toolkit (IA-64 アーキテクチャーのみ)

新着ドキュメント


バージョン 7.2

その他ドキュメント


ケーススタディ

理化学研究所: 「MPI プログラムのチューニングでインテル トレース・アナライザー/コレクターが大変役立ちました。インテル トレース・アナライザー/コレクターで解析したところ、MPI の通信で、ノンブロッキング通信を多数発行しているところで性能が出ていないことが発見でき、これを1対1のブロッキング通信に分割したところ、通信時間は半分程度に高速化されました。 また、インテル トレース・コレクターでプログラムに情報を埋め込むことで、各関数の実行時間やロードバランスを調べることができ、高速化すべきところが容易にわかるようになりました。」

理化学研究所は、物理学、化学、工学、生物学、医科学など幅広い分野にわたり、基礎 研究から応用研究まで多様な研究活動を展開しています。

博士(理学) 古石 貴裕 氏
戎崎計算宇宙物理研究室
独立行政法人 理化学研究所

  • バージョン 7.2 好評発売中
    バージョン 7.2 では、 インテル® トレース・アナライザー GUI で正当性検証レポートが利用可能になったほか、Microsoft Windows Vista と HPC Server 2008 のサポートが追加されました。機能詳細はこちら

  • 7.2 Linux 版インストール時の注意点
    インストール時には必ず root ユーザーでインストールを行ってください。 (root ユーザー以外でインストールした場合、エラーになりインストールできない場合があります。 )