
インテル® プロセッサーベースのクラスターでパフォーマンスを向上
インテル® プロセッサー・ベースのクラスター上で、ハイパフォーマンスなアプリケーションの解析、最適化、配備を行います。インテル® トレース・アナライザー/コレクターは、MPI 通信によるパフォーマンスのボトルネックを素早く発見することで、MPI クラスターのパフォーマンスを理解および最適化するための重要な情報を提供します。バージョン 7.2 には、トレースファイルの比較機能とカウンターデータの表示機能、およびMPI 正当性検証ライブラリーが新たに含まれています。
特長
- MPI やその他のアプリケーション実行時のイベントトレースをグラフィカルに表示し、手軽に分析するためのツールを提供します。任意のレベルの詳細情報にすばやくアクセスできるため、パフォーマンス上の hotspot やボトルネックを容易に特定できます。
- スケーラブルな表示機能によって、クラスタ、ノード、プロセスなどさまざまな抽象化レベルでトレースデータを表示します。
- アプリケーション実行時の動作に関する重要なデータをミクロレベルおよびマクロレベルで表示します。
|
| MPI パフォーマンスの解析、並列アプリケーション実行のスピードアップ、hotspot とボトルネックの特定、詳細な解析とアラインされたタイムラインのグラフィック表示でトレースファイルの比較を行います。 | ||||||||||||||||||||||||||||
インテル® TAC 7.2 の利点
|
||||||||||||||||||||||||||||
多機能、さまざまなオプション、大幅なパフォーマンス向上
|
||||||||||||||||||||||||||||
トレースコレクター
|
||||||||||||||||||||||||||||
トレース・アナライザー
|
||||||||||||||||||||||||||||
| MPI 検証
インテル® トレース・アナライザー/コレクターに含まれる特殊な MPI 正当性検証機能によって、デッドロック、データ破損、または MPI パラメーター、データ型、バッファー、コミュニケーター、PTP メッセージと集合操作のエラーを検出します。実行時の確認機能、検出時のエラー報告などにより、デバッグプロセスの迅速な処理が可能です。正当性検証機能ではまた、小さなフットプリントで、デバッガーのブレークポイントをインプレース解析に役立たせることができます。 トレース・アナライザー/コレクターの正当性検証機能の真価は、非常に大規模なシステムにスケーリングできる潜在能力と、多数のプロセス間でもエラーを検出できる能力にあります。検証機能は、プロファイル (特定の実装) に基づいて動作するように設定でき、ファブリックの種類を問わずデッドロックを表示できます。 データ型をトラックし、MPI 呼び出しをラッピングすることにより、リクエストとコミュニケーターをトレースコレクターで再利用することができます。(検証ライブラリーはパフォーマンス・データ収集ライブラリーのソースコードからコンパイルされます。)アナライザーは、非常に迅速にコールスタックをアンワインドし、デバッグ情報を使用して、フレームポインターあり/なしで命令アドレスをソースコードにマップします。 コマンドライン・インターフェイスおよび GUI インターフェイスの両方で、ユーザーはバッチのセットアップやインタラクティブなデバッギングを追加で行うことができます。タイムライン・ビューは、実際の関数呼び出し、およびプロセスの相互作用を表示し、誤った実行順が原因の大幅な遅延やエラーを強調します。 インストルメンテーションとトレース インテル® トレース・アナライザー/コレクターは、影響の少ないバイナリー・インストルメンテーションに特化しています。静的および動的にリンクされた既存のバイナリー実行形式にこのインストルメンテーションを作成して追加することができ、MPI および関数の入口/出口ポイントを自動的にモニターすることができます。これには、C、C++、Fortran の並列スレッドにおけるパフォーマンス・データのトレース機能と記録機能も含まれます。 インテル® トレース・アナライザー/コレクターは、C、C++、Fortran を使用する MPI アプリケーションと分散型非 MPI アプリケーションの両方をサポートしています。インテル® MPI ライブラリーと動作するアプリケーションの場合、内部 MPI ステートのトレースもサポートされます。 インターフェイスと表示機能 | ||||||||||||||||||||||||||||
タイムライン・ビューと並列ビュー
|
||||||||||||||||||||||||||||
![]() 図 1. タイムライン・ビューと並列ビュー | ||||||||||||||||||||||||||||
高度な GUI
| ||||||||||||||||||||||||||||
スケーラブルな表示機能
| ||||||||||||||||||||||||||||
ミクロレベルおよびマクロレベルの表示
|
||||||||||||||||||||||||||||
![]() 図 2. 2 つのトレースファイルを比較する新しい比較表示 | ||||||||||||||||||||||||||||
使いやすさ
|
||||||||||||||||||||||||||||
![]() 図 3. 新しいカウンター・タイムライン表示 | ||||||||||||||||||||||||||||
| メトリクス・トラッキング 通信統計
| ||||||||||||||||||||||||||||
![]() 図 4. 同期通信と非同期通信 | ||||||||||||||||||||||||||||
実行統計
| ||||||||||||||||||||||||||||
プロファイリング・ライブラリー
| ||||||||||||||||||||||||||||
統計の可読性
| ||||||||||||||||||||||||||||
|
| ハードウェア | |||||||||||||
| 最小要件 |
| ||||||||||||
| オペレーティング・システム・サポート | |
|
全 3 アーキテクチャー |
Red Hat Enterprise Linux 4.0、5.0 SUSE Linux Enterprise Server (SLES) 9、10 |
|
IA-32 およびインテル® 64 アーキテクチャー |
Microsoft Windows Vista |
| インテル® 64 および IA 64 アーキテクチャー | SGI ProPack 5 |
| IA-32 アーキテクチャーのみ | Microsoft Windows XP |
| インテル® 64 アーキテクチャーのみ | Red Hat Fedora Core 7 から 8 cAos 2 CentOS 4.6、5.1 openSuSE Linux 10.3 Microsoft Windows Compute Cluster Server 2003 Microsoft Windows Server 2003 Microsoft Windows XP Professional x64 Edition Microsoft Windows HPC Server 2008 Microsoft Windows Server 2008 |
| その他の対応ソフトウェア |
| インテル® MPI ライブラリーまたは MPICH |
| インテル® MPI ベンチマーク |
| インテル® マス・カーネル・ライブラリー |
| インテル® C++ コンパイラー |
| インテル® Fortran コンパイラー |
| GNU C、C++、FORTRAN77 コンパイラー |
| SGI Message Passing Toolkit (IA-64 アーキテクチャーのみ) |
新着ドキュメント
バージョン 7.2
- トレース・アナライザー/コレクター 7.2 Windows 版 リリースノート (英語)
- トレース・アナライザー/コレクター 7.2 Windows 版 入門ガイド (英語)
- トレース・アナライザー/コレクター 7.2 Windows 版 インストールガイド (英語)
- トレース・アナライザー/コレクター 7.2 Linux 版 リリースノート (英語)
- トレース・アナライザー/コレクター 7.2 Linux 版 入門ガイド (英語)
- トレース・アナライザー/コレクター 7.2 Linux 版 インストールガイド (英語)
その他ドキュメント
- トレース・アナライザー/コレクター 7.1 リリースノート
- トレース・アナライザー/コレクター 7.1 よくある質問と回答 (FAQ)

- トレース・アナライザー/コレクター 7.1 入門ガイド
- トレース・アナライザー 4.0 インストール ガイド

- トレース・コレクター 5.0 インストール ガイド
ケーススタディ
理化学研究所: 「MPI プログラムのチューニングでインテル トレース・アナライザー/コレクターが大変役立ちました。インテル トレース・アナライザー/コレクターで解析したところ、MPI の通信で、ノンブロッキング通信を多数発行しているところで性能が出ていないことが発見でき、これを1対1のブロッキング通信に分割したところ、通信時間は半分程度に高速化されました。 また、インテル トレース・コレクターでプログラムに情報を埋め込むことで、各関数の実行時間やロードバランスを調べることができ、高速化すべきところが容易にわかるようになりました。」
理化学研究所は、物理学、化学、工学、生物学、医科学など幅広い分野にわたり、基礎 研究から応用研究まで多様な研究活動を展開しています。
博士(理学) 古石 貴裕 氏
戎崎計算宇宙物理研究室
独立行政法人 理化学研究所




