トレース アナライザー/コレクター
MPI 通信によるパフォーマンスのボトルネックを素早く発見

インテル Parallel Studio XE 製品好評発売中» 詳細

製品の技術情報・評価ガイド» 詳細

製品に関する書籍を紹介» 詳細

iSUS


インテル® プロセッサー・ベースのクラスター上で、ハイパフォーマンスなアプリケーションの解析、最適化、配備を行います。インテル® トレース・アナライザー/コレクターは、MPI 通信によるパフォーマンスのボトルネックを素早く発見することで、MPI クラスターのパフォーマンスを理解および最適化するための重要な情報を提供します。

インテル® Trace Analyzer/Collector 単体製品販売終息のお知らせ
2010年 11月 9日を以って、インテル® Trace Analyzer/Collector の単体製品での販売が終息しました。今後はバンドル製品をお買い求めください。


特徴

  • MPI やその他のアプリケーション実行時のイベントトレースをグラフィカルに表示し、手軽に分析するためのツールを提供します。任意のレベルの詳細情報にすばやくアクセスできるため、パフォーマンス上の hotspot やボトルネックを容易に特定できます。

  • スケーラブルな表示機能によって、クラスタ、ノード、プロセスなどさまざまな抽象化レベルでトレースデータを表示します。

  • アプリケーション実行時の動作に関する重要なデータをミクロレベルおよびマクロレベルで表示します。

バージョン 8.0 の新機能

Application Imbalance ダイアグラム (アプリケーションの負荷不均衡を示す図表) による簡単なアプリケーション解析
新しく追加された Ideal Interconnect Simulator (IIS: 理想的な相互接続シミュレーター) によるアプリケーションの負荷バランスの表示
Custom Plug-in Framework (CPF: カスタム・プラグイン・フレームワーク) によるさまざまな相互接続を使用したアプリケーション動作のシミュレーション
パフォーマンスの向上

機能と利点

MPI パフォーマンスの解析、並列アプリケーション実行のスピードアップ、hotspot とボトルネックの特定、詳細な解析とアラインされたタイムラインのグラフィック表示でトレースファイルの比較を行います。
 
インテル® TAC 8.0 の利点
高度な GUI: ユーザー・フレンドリーなインターフェイス、ハイレベルなスケーラ ビリティー、STF (Structured Trace File) 形式のトレースデータ、Linux OS およ び Windows OS で動作
集計とフィルタリング: 実行時の動作を関数別やプロセス別に詳細表示
MPI 通信: 特定の時間間隔における MPI の通信状況を表示
フェイルセーフ・トレース機能: デッドロック検出により、アプリケーションの強 制終了に備えた機能が向上
インテル® MPI ライブラリー・インターフェイス: MPI 内部状況のトレースをサポート。MPI-IO のサポート
正当性検証: 実行時に MPI エラーとシステムエラーを確認
ROMIO: MPI-2 規格準拠の並列ファイル I/O のサポートを拡張
IA-32 およびインテル® 64 アーキテクチャー上でのバイナリー・インストルメン テーション
比較機能: 2 つのトレースファイルや 2 つの領域 (1 つまたは 2 つのトレースファ イル内) を並べて比較
カウンター・タイムライン: 提供されているパフォーマンス API (PAPI) モジュール および OS モジュール、または手動でインテル® トレースコレクター API を使用して収集されたカウンターデータを解析
インテル® トレース・アナライザーの統合オンラインヘルプと専用コマンドライ ン・インターフェイス
 
 
インテル® TAC 7.2 の利点
Linux および Microsoft Windows (Windows Compute Cluster Server 2003、Windows XP および Windows Server 2003) でのサポート
多くのドリルダウン表示オプションを備えた、直感的でフルカラーのカスタマイズ可能 GUI
低オーバーヘッドで効率的なメモリー使用により高度にスケーラブル
簡単なランタイムロード - MPI アプリケーション実行ファイルのインストルメント
MPI 正当性検証ライブラリーにより、通信における多くの種類のエラーを検出
統合されたオンラインヘルプ
簡単なインストールと詳細なドキュメント
フルトレース/軽量な統計収集
 

インテル® TAC 7.2 新機能

インテル® トレース・アナライザー GUI で正当性検証レポートが利用可能に!
Trolltech Qt 4.x への移行で一新したルックアンドフィール
 
多機能、さまざまなオプション、大幅なパフォーマンス向上
PIN ベースのバイナリー・インストルメンテーション
関数、プロセス、スレッド、タイムライン、またはクラスターやノード別に表示される実行時の動作
複数のフィルタタイプ (関数、プロセス、メッセージ) と集計
パフォーマンス・カウンター・データ記録のタイムラインでの表示
ランタイム・オーバーヘッドとメモリー消費を抑えるためのトレースデータのキャッシュ
非 MPI アプリケーションに対するイベントベースのトレース用にマルチスレッド MPI アプリケーションをトレース
フェイルセーフ・トレース機能
MPI-2、SHMEM、MPI-IO、ROMIO のサポート
MPI 正当性検証ライブラリー (Linux) による分散メモリー確認機能
 
トレースコレクター
自動 MPI トレース機能と MPI 正当性検証機能
汎用的な分散 (非 MPI) およびシングル・プロセス・トレース機能
アプリケーションがクラッシュした場合でも作成されるトレースでのスレッドレベル・トレース機能
HPM データ収集 (PAPI、rusage、OS カウンター)
設定可能なトレースファイル・パラメーター
機能の無効化/有効化
チューニング・パラメーター
Valgrind による分散メモリー確認機能
バイナリー・ランタイム・インストルメンテーション
コンパイラー・インストルメンテーション
 

1. Icc/ifort/icpc -tcollect

 

2. Gcc/g++ -finstrument-functions

API: ソースコード・インストルメンテーション (カウンター、関数、メッセージと集合操作を記録)
 
トレース・アナライザー
イベント・タイムライン、質的タイムライン、量的タイムライン、カウンター・タイムライン
柔軟なメッセージと集合操作プロファイル
関数プロファイル (コールグラフ、コールツリー、フラットバランスとロードバランス)
詳細比較 (2 トレース)
フルテキスト・ブラウザーによるマルチレベルのソースコードの視覚化
柔軟で強力なイベントのタグ付けとフィルタリング
関数またはプロセスデータの階層型グループ分けと集計
チャートごとの設定パラメーター・セット
テキストでのプロファイリング・データのエクスポート、グラフィックまたはプリンターへのチャートのエクスポート
コマンドライン・インターフェイス
 
MPI 検証

インテル® トレース・アナライザー/コレクターに含まれる特殊な MPI 正当性検証機能によって、デッドロック、データ破損、または MPI パラメーター、データ型、バッファー、コミュニケーター、PTP メッセージと集合操作のエラーを検出します。実行時の確認機能、検出時のエラー報告などにより、デバッグプロセスの迅速な処理が可能です。正当性検証機能ではまた、小さなフットプリントで、デバッガーのブレークポイントをインプレース解析に役立たせることができます。

トレース・アナライザー/コレクターの正当性検証機能の真価は、非常に大規模なシステムにスケーリングできる潜在能力と、多数のプロセス間でもエラーを検出できる能力にあります。検証機能は、プロファイル (特定の実装) に基づいて動作するように設定でき、ファブリックの種類を問わずデッドロックを表示できます。

データ型をトラックし、MPI 呼び出しをラッピングすることにより、リクエストとコミュニケーターをトレースコレクターで再利用することができます。(検証ライブラリーはパフォーマンス・データ収集ライブラリーのソースコードからコンパイルされます。)アナライザーは、非常に迅速にコールスタックをアンワインドし、デバッグ情報を使用して、フレームポインターあり/なしで命令アドレスをソースコードにマップします。

コマンドライン・インターフェイスおよび GUI インターフェイスの両方で、ユーザーはバッチのセットアップやインタラクティブなデバッギングを追加で行うことができます。タイムライン・ビューは、実際の関数呼び出し、およびプロセスの相互作用を表示し、誤った実行順が原因の大幅な遅延やエラーを強調します。

インストルメンテーションとトレース

インテル® トレース・アナライザー/コレクターは、影響の少ないバイナリー・インストルメンテーションに特化しています。静的および動的にリンクされた既存のバイナリー実行形式にこのインストルメンテーションを作成して追加することができ、MPI および関数の入口/出口ポイントを自動的にモニターすることができます。これには、C、C++、Fortran の並列スレッドにおけるパフォーマンス・データのトレース機能と記録機能も含まれます。

インテル® トレース・アナライザー/コレクターは、C、C++、Fortran を使用する MPI アプリケーションと分散型非 MPI アプリケーションの両方をサポートしています。インテル® MPI ライブラリーと動作するアプリケーションの場合、内部 MPI ステートのトレースもサポートされます。

インターフェイスと表示機能

タイムライン・ビューと並列ビュー
並列アプリケーションの並行した動作を表示
時間軸に沿ってアプリケーションのアクティビティー、イベント・ソース・コードの場所、メッセージパッシングを表示 (図 1 を参照)

図 1. タイムライン・ビューと並列ビュー

高度な GUI
高速なインターフェイスで表示と統計を管理
詳細を表示するオブジェクトのポイント・アンド・ズーム、状況依存サブメニュー
対になった表示で重点的な解析が可能
再計算された統計を自動的に更新
並列実行の特定の段階における関数グループと通信のタイムライン表示、コールグラフ、パフォーマンス・プロファイルを提供
スケーラブルな表示機能
トレースデータの抽象レベルによって移動: クラスター、ノード、プロセス、スレッド、関数階層 (クラス)
ミクロレベルおよびマクロレベルの表示
アプリケーション・ランタイムの動作を関数別やプロセス別に詳細表示
費やされた時間量を簡単に識別 (MPI 通信など)
2 つのプログラム実行間のパフォーマンスの違いを簡単に確認 (図 2 を参照)

図 2. 2 つのトレースファイルを比較する新しい比較表示

使いやすさ
ユーザーイベントを制御または記録できるユーザーフレンドリーなアプリケーション・プログラミング・インターフェイス (API) を提供
多目的に使用できる記録機能とカウンターデータの解析を追加 (図 3 を参照)

図 3. 新しいカウンター・タイムライン表示

メトリクス・トラッキング

通信統計
並列アプリケーションの通信パターンを表示
任意の時間間隔のメトリクスを表示
比較を通してアルゴリズムの変更によるパフォーマンスの変化を追跡
図 4 は、通信オーバーヘッド (赤) とともに同じアルゴリズムの同期通信 (左) と非同期通信 (右) を示しています。

図 4. 同期通信と非同期通信

実行統計
コールツリー特性レベルまで掘り下げたサブルーチン実行メトリクスを提供
バイナリー、コンパイラー駆動、およびソースコード・インストルメンテーションにより、MPI を超える非常に詳細な解析を提供
プロファイリング・ライブラリー
分散型イベントベースのトレースデータを記録
統計の可読性
アプリケーション・ランタイムの動作を関数別やプロセス別に詳細表示 関数呼び出し、メッセージ送信、集合演算の情報を記録

バージョン 8.0 Windows 版、Linux 版

ハードウェア

最小要件
(Window版と Linux 版で同じ要件)

IA-32アーキテクチャー・ベース・システム

インテル® Pentium® 4 プロセッサー以上
インテル® Core™ i7 プロセッサー推奨

インテル® 64 アーキテクチャー・ベース・システム

インテル® Core™ プロセッサー・ファミリー以上
インテル® Xeon® プロセッサー 5500 番台推奨


1 コアあたり 1GB RAM (2GB RAM 推奨)
1GB のディスク空き容量


オペレーティング・システム・サポート

Windows 版

IA-32アーキテクチャー・ベース・システム

Microsoft Windows 7

インテル® 64 アーキテクチャー・ベース・システム

Microsoft Windows 7
Microsoft Windows HPC Server 2008
Microsoft Windows HPC Server 2008 R2
Microsoft Windows Server 2008
Microsoft Windows Server 2008 R2

Linux 版

IA-32アーキテクチャー・ベース・システム

Red Hat Enterprise Linux 5、6
SUSE Linux Enterprise Server (SLES) 10、11

インテル® 64 アーキテクチャー・ベース・システム

Red Hat Enterprise Linux 5、6
SUSE Linux Enterprise Server (SLES) 10、11
Fedora 15
CentOS 5.3
openSuSE Linux 11.1

対応 MPI  (IA-32 およびインテル® 64 アーキテクチャー)
インテル® MPI ライブラリー 3.x、4.x Windows 版または Linux 版

バージョン 8.0

ファイル OS タイプ サイズ 概要
8.0 Update 3
リリースノート (英語)
TXT
 

概要 (新機能、製品内容を含む)、動作環境、
既知の制限事項を説明しています。

TXT
 
リリースノート
TXT
 

概要 (新機能、製品内容を含む)、動作環境、
既知の制限事項を説明しています。

TXT
 
インストールガイド (英語)
HTML
 

インストールの条件、製品のインストール手順、アンインストールの方法を紹介しています。

HTML
 
入門ガイド (英語)
PDF
 

製品の基本的なの操作方法を説明しています。

PDF
 
PDF
 

 

トレース・アナライザー
リファレンスガイド (英語)
PDF
   
トレース・コレクター
リファレンスガイド (英語)
PDF
   

バージョン 7.2

ファイル OS タイプ サイズ 概要
リリースノート (英語)
TXT
 

概要 (新機能、製品内容を含む)、動作環境、
既知の制限事項を説明しています。

TXT
 
インストールガイド (英語)
HTML
 

インストールの条件、製品のインストール手順、アンインストールの方法を紹介しています。

HTML
 
入門ガイド (英語)
PDF
 

製品の基本的なの操作方法を説明しています。

PDF
 
PDF
 

 

トレース・アナライザー
リファレンスガイド (英語)
PDF
   
トレース・コレクター
リファレンスガイド (英語)
PDF
   

バージョン 7.1 以前

ファイル タイプ サイズ 概要
TXT
 

概要 (新機能、製品内容を含む)、動作環境、
既知の制限事項を説明しています。

PDF
   
HTML
 

製品の基本的なの操作方法を説明しています。

PDF
 

 

トレース・コレクター 5.0
インストール ガイド
PDF
   


 

バージョン情報

  • バージョン 8.0
    バージョン 8.0 では、 Application Imbalance ダイアグラム による簡単なアプリケーション解析や Ideal Interconnect Simulator (IIS) による簡単なアプリケーション解析の機能が追加されました。

お知らせ

  • 8.0 ご使用時の注意点
    インストール時には、日本語を含まないパスにインストールしてください。詳細はこちら

  • 7.2 Linux 版ご使用時の注意点
    インストール時には必ず root ユーザーでインストールを行ってください。 (root ユーザー以外でインストールした場合、エラーになりインストールできない場合があります。 )
 
. . . . . .