インテル® VTune™ Amplifier XE 2017

C/C++、Fortran、Python、Go、Java 対応の高度なパフォーマンス/スレッド・プロファイラーです。
関連情報
[お知らせ一覧]

精度の高いデータで高速なアプリケーションを素早く開発

始めてのチューニングから高度な最適化にわたって、インテル® VTune™ Amplifier XE は CPU と GPU パフォーマンス、スレッドのパフォーマンスとスケーラビリティー、バンド幅、キャッシュ利用など、パフォーマンス向上のための豊富な情報を収集します。一般的なスレッド化モデルをサポートし、解析を支援するハイレベルな情報を提供するため、素早く簡単にチューニングを行うことができます。解析結果をタイムラインとソースコード上でソート、フィルターして可視化できます。

シングルコード・プロファイラーとは異なり、C/C++、Fortran、Python*、Go*、Java* が混在したコードの hotspot を正確に特定します。

詳細・新機能 技術情報

最新のプロセッサーのパフォーマンス解析

最新のプロセッサーのパフォーマンスを解析する場合、シングルスレッド・パフォーマンスを最適化するだけでは十分ではありません。ハイパフォーマンスなコードには、次のものが求められます。

  • 複数の CPU を利用するためのスレッド化とスケーラビリティー
  • 複数の FPU を効率良く使用するためのベクトル化
  • NUMA とキャッシュを利用するためのチューニング

メディア・アプリケーションでは、OpenCL* と GPU のチューニングも必要になります。インテル® VTune™ Amplifier XE では、これらの高度なプロファイル機能をフレンドリーな 1 つのインターフェイスから利用できます。

インテル® Parallel Studio XE の解析ツール、ランタイム、 コンパイラーとの連携

インテル® VTune™ Amplifier XE は、インテル® Parallel Studio XE に含まれる次の解析ツールと連携可能です。

インテル® Advisor XE

ベクトル化の最適化とスレッドのプロトタイプ生成に役立ちます。

インテル® Trace Analyzer & Collector

MPI アプリケーションを検証し、スレッド化より最も大きな利点が得られるループをインテル® VTune™ Amplifier XE に知らせます。

製品紹介資料

本ツールが同梱されるインテル® Parallel Studio XE の製品概要、新機能、各エディションの違いやコンポーネント、パフォーマンス、お客様の声などをご紹介しています。

PDF

  • 現在は PDF 版のみ公開しています。ブラウザ表示板は近日公開予定です。

ライセンス

特定ユーザーライセンス、フローティング・ライセンスが提供されています。
ライセンス規定の詳細はライセンスページを参照ください。

特定ユーザーライセンス

特定の一個人に製品を使用する許可を与えます。

フローティング・ライセンス

同時に利用するマシン数が購入ライセンス数を超えない限り、複数台のマシンに製品をインストールし、利用することができます。

  • 現在 1-Pack ライセンスのみ販売
ライセンス詳細

OS

OS 別に 2 種類の製品が提供されています。

Windows

Linux

製品一覧

製品 OS ライセンス
インテル® VTune Amplifier XE for Windows 特 / フ
for Linux 特 / フ
  • 特: 特定ユーザーライセンスフ: フローティング・ライセンス

スイート製品に同梱

単体販売のほか、以下製品にも同梱されます。

インテル® Parallel Studio XE

アプリケーションの高速化、安定化を支援するスイート製品です。Professional Edition 以上にインテル® VTune™ Amplifier XE が同梱されます。

インテル® Media Server Studio

ハイパフォーマンスで高品質なエンタープライズ・ グレードのメディア・ソリューション開発を支援するスイート製品です。Professional Edition にインテル® VTune™ Amplifier XE が同梱されます。

インテル® System Studio

組込み/モバイルデバイス向けシステムの電力効率、パフォーマンス、信頼性向上を支援するスイート製品です。Professional Edition 以上にインテル® VTune™ Amplifier for Systems が同梱されます。

  • インテル® VTune™ Amplifier XE
    Windows* と Linux* アプリケーションのパフォーマンスをプロファイルします。
  • インテル® VTune™ Amplifier for Systems
    組込みターゲットのプロファイルをします。バッテリー駆動のシステム向けエネルギー・プロファイラーが含まれます。

バージョン 2017 新機能

主に以下の変更・機能が追加されました。
詳細は、リリースノートおよびインテル社公開の情報を参照ください。

  • Python* とネイティブコードの両方をプロファイル

    Python* とネイティブ C/C++/Fortran が混在しているコードをプロファイルできるようになりました。ネイティブコードを呼び出している場合でも、Python* または Go* アプリケーションのパフォーマンス・ボトルネックを特定できます。

  • ハードウェア・パフォーマンスにとって重要な 3 つのメトリックを素早くプロファイル

  • インテル® Xeon Phi™ プロセッサーのチューニング (内蔵 MCDRAM を含む)

  • ストレージ解析 - I/O と計算の相互作用をチューニング

最初にチューニングすべきことは?
多くの時間を費やしているコードを素早く特定

hotspot 解析結果では、多くの CPU 時間を費やしている関数のリストがソートして表示されます。これにより、チューニングによって最大の効果が得られる箇所を確認できます。[+] をクリックするとコールスタックが表示され、ダブルクリックで該当するソースコードが表示されます。

結果を素早く解析 – プロファイルデータをソース上に表示

関数リストをダブルクリックすると、関数で最も時間を費やしているソースコード内の該当箇所に移動します。

New – Python* および Python* / C++ / C / Fortran 混合コードをプロファイル

Python* とネイティブコードの両方をプロファイル。多くの Python* プロファイルでコードを遅くしない低オーバーヘッドのサンプリング技術から正確なデータを取得します。 コールスタックを含む、ソース行の詳細情報を取得。パフォーマンス向上のためのネイティブ拡張を使用? Python* の専用プロファイラーとは異なり、ネイティブ C、C++ および Fortran コードも、プロファイリングおよびチューニングできます。

New – 最新プロセッサー上でパフォーマンスを発揮する 3 つのポイントを参照

最新ハードウェアのパフォーマンスを発揮するための 3 つの重要な要素の概要を取得するには、新しい HPC パフォーマンスの特徴付けを使用します: CPU 使用率(スレッド)、メモリーアクセス、および FPU 使用率 (FLOPS)。それから、各要素に対して、詳細な分析をドリルダウンします。

マルチコアの世界ではスレッドのパフォーマンスが重要な課題

インテル® VTune™ Amplifier XE は、インテル® TBB、OpenMP* 4.x およびインテル® Cilk™ PLus などのスレッド化モデルをサポートしており、タスクの開始/終了、同期、待機時間などマルチスレッドの概念を簡単に理解することができます。待機時間を確認する "Lock & Wait" 解析 (次にあるイメージ) は便利な機能の 1 つです。タイムラインの可視化 (以下の 2 番目のイメージ) では、ロック競合 (黄色のトランジション)、負荷インバランス、そして不用意なシリアル化など、並列処理のパフォーマンスを低下させるすべての原因を容易に検出できます。

"locks and waits" 解析で遅いスレッドのコードの一般的な原因を特定

ロックでの長時間の待機は、待機中のコアが十分に活用されず、並列プログラムのパフォーマンスを低下させる一般的な原因となります。"basic hotspots" と "locks & waits" プロファイルは、インテルおよび互換プロセッサーの両方で動作するソフトウェア・コレクターを利用しています。

素早く結果を確認可能 – タイムラインのフィルター処理で必要なデータを得る

タイムラインで time range を選択し、情報をマスクして必要なデータをフィルターする (例えばアプリケーションの起動時間)。タイムラインを選択してフィルターすると、選択された範囲のグリッドの CPU 時間を多く消費している 関数リストが更新されます。黄色の線は低速なトランジションです。過度のトランジションは、ロック競合と低い並列パフォーマンスを示すことがあります。スピンロックの問題を診断するため CPU 時間のマークを無効にする – スレッドが実行中もしくは待機中の時間だけを表示し、必要のないシリアル化を特定します。

リモートシステムを簡単にプロファイル – ライセンスはホストのみに必要で、ターゲットには不要

現在のホストまたはリモートシステム上で簡単にデータを収集できます。もしくは、リモートシステム上でコマンドラインを使用してデータを収集し、その後ホストでインポートしてローカルでデータを解析できます。

ヒント: 最適なパフォーマンスを達成するには、VNC スロー・グラフィックスは避けましょう。UI をローカルで実行してください。リモートターゲットからデータをインポートしましょう。リモートシステムへのインストールとデータの収集にはライセンスは必要ありません。ライセンスは、収集したデータを分析もしくは表示する場合にのみ必要です。リモートデータ収集については、こちらの iSUS の記事もご覧ください。

ドライバーをチューニング。低いオーバーヘッドで高い精度を得る

インテル® プロセッサーは、オンチップのパフォーマンス・モニタリング・ユニット (PMU) を搭載しています。インテルおよび互換プロセッサーで動作する "basic hotspots" 解析に加え、インテル® VTune™ Amplifier XE には、インテル® プロセッサー上のパフォーマンス・モニタリング・ユニット (PMU) を使用した非常にオーバーヘッドの少ない収集を行う "advanced hotspots" があります。システム全体の解析では、ドライバーも分析できます。高解像度 (~1 ミリ秒対 ~10 ミリ秒) で小さな関数中のホットスポットを検出できます。

"あらかじめプリセットされた" バンド幅とメモリー解析で簡単にセットアップ

あらかじめプリセットされたプロファイルで、簡単に解析の設定が可能。複雑なイベント名を覚えることなく、バンド幅をチューニングしキャッシュ効率を最適化できます。

パフォーマンスが向上する可能性がある箇所をハイライト

ピンク色にハイライト表示された項目は、チューニングでパフォーマンスが向上する可能性がある事を示します。マウスオーバーすることでチューニングのためのアドバイスが表示されます。

簡単で、より効率良い OpenMP* と MPI マルチランクのチューニング

サマリーレポートは、効率良く OpenMP* のパフォーマンスを改善するための上位 4 つの問題を表示します。リンクをクリックすると詳しい情報を取得できます。

OpenMP* のパフォーマンスをどのように改善できるか素早く参照可能

それぞれの OpenMP* 領域のチューニングでパフォーマンスが向上する可能性をハイライトします。例えば、参考画面のイメージでは、バランスを調整することで 34% 高速になる可能性があります。

MPI + OpenMP* のマルチランクを簡単に解析

インテル® VTune™ Amplifier XE のサマリー表示には、改善された OpenMP* パフォーマンスによって、パフォーマンスが向上する上位の MPI ランクのテーブルがまとめられています。

MPI と OpenMP* のハイブリッド・アプリケーションでは、ランク間の MPI 通信とともに OpenMP* が非効率である部分を探すことが重要です。少ない通信スピン時間で多くのランクが実行され、そしてより多くの OpenMP* チューニングがアプリケーションの実行時間に影響します。MPI のチューニングには、インテル® Trace Analyzer & Collector を使用し、通信スピン時間が低いランクを選択してインテル® VTune™ Amplifier で分析します。インテル® VTune™ Amplifier XE はクラスターにインストールできます。

New – ストレージデバイス解析 (HDD、SATA または NVMe SSD)

I/Oバウンドまたは CPU バインドが起こっていますか? I/O 操作(非同期および同期)と計算の間のインバランスを調査しましょう。 CPU が I/O を待っているときに、ソースコードにマッピングされたストレージアクセスを参照してください。

使いやすい OpenCL™ と GPU プロファイル – Windows* と Linux で利用可能!

新しいプロセッサー上で OpenCL* をチューニングする場合、GPU アーキテクチャーのダイアグラムによって GPU ハードウェアのメトリックを簡単に確認することができます。

GPU とプラットフォームのデータを解析

最新のプロセッサーでは、必要に応じて OpenCL* とメディア・アプリケーション向けの GPU とプラットフォーム・データを収集できます。GPU/CPU アクティビティーを関連付けることが可能です。

特殊なコンパイラーやビルドは不要

低オーバーヘッドの収集は、データの精度を高めます。

コマンドラインを使用して自動化

コマンドライン・ツールを使用して回帰テストを自動化できます。また、簡単にリモート収集を行うためリモートシステムに軽量コンポーネントをインストールできます。

システム全体の解析

ドライバー、カーネルモデル、そしてマルチプロセス・アプリケーションをチューニング。

Microsoft* DirectX* フレームの自動識別

Windows* ゲーム中の低速な部分は? 開発者は、ゲーム中で時間がかかりフレームレートの低い場所を特定するために多くの時間を費やす必要はありません。インテル® VTune™ Amplifier XE を使うことで、Microsoft* DirectX* のフレームを自動的に認識し、遅いフレームで何が起こっているかを見るためのフィルター処理が可能です。DirectX* を使用していない場合は? 時間がかかる場所に API を追加してフレーム解析を行うことで、遅延を解析することができます。

低オーバーヘッドの Java* プロファイル

Java* コードもしくは Java* とネイティブ・コードが混在したコードの解析結果を元の Java* のソースにマッピングします。インストルメント・コードを使用するほかの Java* プロファイラーとは異なり、インテル® VTune™Amplifier XE は、ハードウェアとソフトウェア収集による低オーバーヘッドの統計的なサンプリングを行います。ハードウェアによる収集は、プロセッサーのパフォーマンス・モニター・ハードウェアを使用するため、非常に低オーバーヘッドです。

ユーザータスクの解析

タスク・アノーテーション API は、インテル® VTune™ Apmplifier XE が実行されたタスクを表示できるよう、ソースに注釈をつけるために使用されます。例えば、パイプラインのステージに API でラベルを付け、タイムラインに表示させることで、領域の詳細を明らかにします。これにより、プロファイルされたデータが分かりやすくなります。

インテル® Xeon Phi™ 製品向けのチューニング

ハードウェア・プロファイルはインテル® Xeon Phi™ 製品でもサポートされ、ホストの GUI 環境から起動できます。"Advenced Hotspots" と高度なイベントデータを収集し、複数のカード間にまたがって相互関係を時間マーカーで示すことができます。

製品トレーニング

  1. 製品概要
  1. Hotspot 解析
  1. Concurrency (コンカレンシー) 解析
  1. Locks & Waits (ロックと待機) 解析
  1. Advanced Hotspots 解析 (前編)
  1. Advanced Hotspots 解析 (後編)

製品セミナーや関連イベントをご紹介。

米インテル社の製品情報を日本語に翻訳して公開中。

アプリケーションの高速化、安定化を支援するスイート製品です。

ハイパフォーマンスで高品質なエンタープライズ・ グレードのメディア・ソリューション開発を支援するスイート製品です。

組込み/モバイルデバイス向けシステムの電力効率、パフォーマンス、信頼性向上を支援するスイート製品です。

マルチスレッド化、ベクトル化のアドバイスツールです。

クラスターシステムの性能解析ツールです。

世界最大規模のクラスターユーザーの 70% が活用しているデバッガー & プロファイラーです。

プロセッサー

インテル® プロセッサー、インテル® コプロセッサー、および互換プロセッサーをサポートします。

  • モバイル・プロセッサー

    • インテル® Atom™ プロセッサー
    • インテル® Core™ i7 Mobile プロセッサー Extreme Edition (第 2、第 3、第 4 および第 5 世代インテル® Core™ プロセッサー)
    • インテル® Core™ i7、i5、i3 Mobile プロセッサー (第 2、第 3、第 4、第 5 および第 6 世代インテル® Core™ プロセッサー)
    • インテル® Core™2 Extreme Mobile プロセッサー
    • インテル® Core™2 Quad Mobile プロセッサー
    • インテル® Core™2 Duo Mobile プロセッサー
    • インテル® Pentium® Mobile プロセッサー
  • デスクトップ・プロセッサー

    • インテル® Atom™ プロセッサー
    • インテル® Core™ i7 Desktop プロセッサー Extreme Edition (第 2、第 3、第 4 および第 5 世代インテル® Core™ プロセッサー)
    • インテル® Core™ i7、i5、i3 Desktop プロセッサー (第 2、第 3、第 4、第 5 および第 6 世代インテル® Core™ プロセッサー)
    • インテル® Core™2 Quad Desktop プロセッサー
    • インテル® Core™2 Extreme Desktop プロセッサー
    • インテル® Core™2 Duo Desktop プロセッサー
  • サーバーおよびワークステーション・プロセッサー

    • インテル® Xeon® プロセッサー E7 ファミリー (v2 および v3)
    • インテル® Xeon® プロセッサー E5 ファミリー (v2 および v3)
    • インテル® Xeon® プロセッサー E3 ファミリー (v2、v3 および v4)
    • インテル® Xeon® プロセッサー D ファミリー
    • インテル® Xeon® プロセッサー 7000 番台
    • インテル® Xeon® プロセッサー 6000 番台
    • インテル® Xeon® プロセッサー 5000 番台
    • インテル® Xeon® プロセッサー 3000 番台
    • インテル® Xeon Phi™ コプロセッサー (開発コード名: Knights Corner)
    • インテル® Xeon Phi™ プロセッサー (開発コード名: Knights Landing)
    • クアッドコア インテル® Xeon® プロセッサー 7xxx、5xxx、および 3xxx シリーズ
    • デュアルコア インテル® Xeon® プロセッサー 7xxx、5xxx、および 3xxx シリーズ
ホスト OS

Linux* と Windows*、OS X* で利用できます。

  • ほかのターゲットで収集されたデータを解析するには、オプションの OS X* ホスト・インターフェイスを別途ダウンロードする必要があります。OS X* 上でのプロファイルの収集は現在サポートされていません。
  • Microsoft* Windows* 7 および SP1
  • Microsoft* Windows Server 2008*
  • Microsoft* Windows* 8 および 8.1 (Windows* ストア・アプリケーションを含む)
  • Microsoft* Windows Server 2012*
  • Microsoft* Windows* 10
  • Red Hat* Enterprise Linux 6 および 7
  • CentOS* (上記 Red Hat* Enterprise Linux* バージョンと同等のバージョン)
  • SUSE* Linux* Enterprise Server (SLES) 11 および 12
  • Fedora* 23 および 24
  • Ubuntu* 14.04、15.10 および 16.04
  • Debian* 7.0 および 8.0
  • OS X* 10.10.*
  • OS X* 10.11.*
ターゲット OS

Windows*、Linux*、Android*、Tizen*、Wind River Linux* および Yocto Project*

開発環境

スタンドアロン、下記の Microsoft* Visual Studio* バージョン (Windows*)、Eclipse* 統合環境

  • Microsoft* Visual Studio* 2012
  • Microsoft* Visual Studio* 2013
  • Microsoft* Visual Studio* 2015 (Update 2、Update 3含む)
コンパイラー

下記のインテル® コンパイラー、そのほか標準に準拠するコンパイラーで動作します。

  • インテル® C/C++ コンパイラー 11 以上
  • インテル® Fortran コンパイラー 11 以上
  • インテル® Parallel Composer
  • Microsoft* Visual Studio* C/C++ コンパイラー (Windows*)
  • Cygwin (Cygwin 1.7.17 と GCC 4.5.3 でテスト済み)
  • MinGW (tested MinGW と GCC 4.6.2 でテスト済み)
  • GNU C/C++ コンパイラー 3.4.6 以上 (Linux*)
言語

C、C++、C#、Fortran、Java*、OpenCL*、Python*、Go™

スレッド化モデル: 完全なスレッド情報

OpenMP*、インテル® スレッディング・ビルディング・ブロック (インテル® TBB)、インテル® Cilk™ Plus、Win32* スレッド (Windows*)、Posix* Threads (Linux*)

スレッドのパフォーマンス解析を拡張

OpenMP*

MPI 並列処理

インテル® Trace Analyzer & Collector (MPI プロファイラー) との統合

GPU

最新のインテル® プロセッサー上の OpenCL* およびメディア・アプリケーションのチューニング

  • 最新の情報は、製品または評価版に同梱されているリリースノートを参照ください。

お知らせ

2016年 9月 7日、インテル® VTune™ Amplifier XE 2017 の販売を開始しました。

過去に製品をご購入いただき、現在有効なサポートサービスをお持ちのお客様は、すぐにバージョン 2017 を無料でダウンロードしてご利用いただけます。

2015年 8月 26日、インテル® VTune™ Amplifier XE 2016 の販売を開始しました。

FAQ

基本的な hotspot (以前の「hotspot」)

  • ソフトウェア・コレクターを使用します。
  • ドライバーは必要ありません。
  • インテル® プロセッサーおよび互換プロセッサーで利用できます。
  • 分解能は ~10 ミリ秒。
  • コールスタックを収集して呼び出しシーケンスを表示します。
  • 仮想環境で動作します。

高度な hotspot

  • ハードウェア・コレクターおよびオンチップのパフォーマンス・モニタリング・ユニットを使用します。
  • インストールに管理者権限が必要なソフトウェアに含まれるドライバーが必要です。
  • 収集にはインテル® プロセッサーが必要です。
  • 分解能は ~1 ミリ秒 (より小さな関数を検出できます)。
  • 最適なコールスタック収集。
  • VM ベンダーでサポートされている場合のみ仮想環境で動作します (VMware vSphere* 5.1 など)。

はい。インテル® VTune Amplifier XE は、インテルの命令セットを含むアプリケーションを解析する場合、インテル® プロセッサーと互換プロセッサーの両方で動作します。ソフトウェア・コレクターを使用するプロファイル機能 (「基本的な hotspot」および「ロックと待機」など) は、インテル® プロセッサーと互換プロセッサーの両方で動作します。ハードウェア・コレクターおよびオンチップのパフォーマンス・モニタリング・ユニットを使用するプロファイル機能 (「高度な hotspot」および「マイクロアーキテクチャー解析」など) は、データ収集にはインテル® プロセッサーが必要ですが、収集後の結果は互換プロセッサーで解析できます。

いいえ。インテル® VTune Amplifier XE でプロファイルを行うために再コンパイルする必要はありません。しかし、最も完全で有用な結果が得られるように、最適化されたアプリケーションでデバッグおよびシンボル情報を有効にすることを推奨します。このため、リリースビルドのプロセスはデバッグ情報を追加するように修正する必要があります。

»マニュアルはこちら

いいえ。製品を入手した後、CLI インストーラー (コマンドライン・インストーラー) から同じ OS のほかのシステムでのデータ収集を設定できます。リモートシステムでは、データの収集はできますが、収集したデータの表示にはライセンスが必要です。データを表示するには、製品をインストールしたシステムに結果ディレクトリーをコピーします。詳細については、ドキュメントの「Remote Tuning Workflow (リモート・チューニング・ワークフロー)」を参照してください。インストールの詳細については、リリースノートの「リモートシステムでのコレクターのインストール」を参照してください。

インテル® VTune Amplifier XE にソースコードが表示されない理由はいくつかあります。

ソースコードを表示するには、デバッグ情報が利用可能になるようにコードをコンパイルする必要があります。例えば、Linux* では、"-g" オプションを指定してコンパイルしていることを確認します。

インテル® VTune Amplifier XE にソースファイル、バイナリーファイル、シンボルファイルの場所を知らせる必要もあります。既存のプロジェクトを開くか新規プロジェクトを作成して、[Project Properties (プロジェクト・プロパティー)] ボタンをクリックします。[Project Properties (プロジェクト・プロパティー)] ダイアログで、[Search Directories (検索ディレクトリー)] タブをクリックします。プルダウンメニューで、[All files (すべてのファイル)] をクリックして、ファイルが含まれているディレクトリーを指定します。サブディレクトリーが含まれる場合は、[Search subdirectories (サブディレクトリーを検索)] ボックスをオンにします。

いいえ。Linux* では、ハードウェア・コレクターのドライバーをインストールするには root 権限が必要ですが、ドライバーをインストールした後は root 権限は必要ありません。プリインストールされる perf ドライバーを使用することもできますが、perf では一部の機能はサポートされていません。Linux* では、ハードウェア・コレクターを使用するには、ドライバー・アクセス・グループ (デフォルトは 'vtune') に属している必要があります (選択されるインストール・オプションに依存します)。ハードウェア・コレクターは、高度な hotspot 解析や高度な解析に使用されます。詳細については、ドキュメントの「Installing the Sampling Driver (サンプリング・ドライバーのインストール)」を参照してください。

ハードウェアベースの (「高度な」) サンプリング解析タイプではプロセッサーのパフォーマンス・モニタリング・ユニット (PMU) との通信が必要になるため、インストーラーはデバイスドライバーをインストールしようとします。Windows® では、ドライバー (署名されています) をインストールするユーザーは管理者グループに属している必要があります。Linux* では、ドライバーをインストールするユーザーは、root ユーザーまたは sudo を利用可能なユーザーである必要があります。Linux* ユーザーは、デバイスドライバーなしでソフトウェアをローカルにインストールして、ユーザーモード・サンプリング解析タイプ (基本的な hotspot、コンカレンシー、ロックと待機) を使用できます。ユーザーはプリインストールされる perf ドライバーを使用することもできますが、perf では一部の機能はサポートされていません。ユーザーが root としてソフトウェアをインストールできる場合、ハードウェアベースのサンプルを収集するユーザーは、インストール中に定義されるユーザーグループに属している必要があります (インストール中に選択されるオプションに依存します)。デフォルトは 'vtune' グループですが、インストーラー (install.sh) の高度なオプションにアクセスして変更または省略することができます。

結果をインテル® VTune Amplifier XE にインポートするには、最初にインポートする結果を含めるプロジェクトを作成する必要があります。インテル® VTune Amplifier XE で、[File (ファイル)] > [New (新規)] > [Project (プロジェクト)] メニューをクリックします。プロジェクト名を指定するダイアログが表示されます。プロジェクト名を指定して、[OK] をクリックします。インテル® VTune Amplifier XE の [Project Properties (プロジェクト・プロパティー)] ダイアログが表示されます。結果をプロジェクトへインポートするときにアプリケーションを指定する必要はありません。しかし、インポートした結果のソースを表示する場合は、ソースおよびバイナリーの場所を検索ディレクトリーに追加する必要があります。[Project Properties (プロジェクト・プロパティー)] ダイアログで、[Search Directories (検索ディレクトリー)] タブをクリックします。プルダウンメニューで、[All files (すべてのファイル)] をクリックして、ファイルが含まれているディレクトリーを指定します。サブディレクトリーが含まれる場合は、[Search subdirectories (サブディレクトリーを検索)] ボックスをオンにします。

検索ディレクトリーは、通常はデータ収集が完了した後に行われるファイナライズ中に使用されます。新しい検索ディレクトリーのパスを有効にするには、提供される新しい情報を使用してインテル® VTune Amplifier XE で結果を再解決する必要があります。[Analysis Type (解析タイプ)] タブをクリックした後、[Start (スタート)] ボタンおよび [Project Properties (プロジェクト・プロパティー)] ボタンの下にある [Re-resolve (再解決)] ボタンをクリックします。

サンプルカウントは、実行可能なコードと通常関連付けられていないソース行 ('for' ループや 'while' ループの閉じ括弧など) に表示されることがあります。間違っているように見えるかもしれませんが、これはコンパイラーによって生成された命令の結果です。アセンブリー・コードを見ると、そのソース行に属するものとしてタグ付けされた (閉じ括弧)、サンプルが関連付けられたアセンブリー命令のデバッグ情報を明らかにすることができます。一方で、アセンブリー命令を見ると、特定のハードウェア・イベントが本来そのイベントを生成しない命令で収集されることがあります (例えば、ジャンプ命令のメモリーイベントやメモリー命令の算術イベント)。これは「イベントスキッド」と呼ばれ、命令ポインターをサンプリングする前にプロセッサーがいくつかのマイクロオペレーションを停止できないことが原因です。つまり、サンプルを処理している間に命令ポインターが後の命令を指してしまうのです。一般に、命令フローを調べることにより、そのイベントの原因となった命令を判断することができます。

アプリケーションが I/O をブロックしている場合、ファイルアクセスに起因する関数呼び出しが基本的な hotspot 解析に表示されます。また、1 つのファイルへのアクセスを待つ複数のスレッドがある場合、ファイルを保護する同期オブジェクト (クリティカル・セクションなど) がロックと待機解析に表示されます。

インテル® レジストレーション・センターで操作します。
操作手順やよくあるご質問、トラブルシューティングは、インテル® レジストレーション・センター操作マニュアルを参照ください。

»マニュアルはこちら

最新版、または旧バージョンのダウンロードは、インテル® レジストレーション・センターで行います。
詳細は以下ページを参照ください。

»製品登録 & ダウンロード

購入

技術情報

サポート