インテル ® VTune™ Amplifier 2018

C/C++、Fortran、Python、Go、Java 対応の高度なパフォーマンス/スレッド・プロファイラーです。
関連情報
[お知らせ一覧]

精度の高いデータで高速なアプリケーションを素早く開発

始めてのチューニングから高度な最適化にわたって、インテル ® VTune™ Amplifier は CPU と GPU パフォーマンス、スレッドのパフォーマンスとスケーラビリティー、バンド幅、キャッシュ利用など、パフォーマンス向上のための豊富な情報を収集します。一般的なスレッド化モデルをサポートし、解析を支援するハイレベルな情報を提供するため、素早く簡単にチューニングを行うことができます。解析結果をタイムラインとソースコード上でソート、フィルターして可視化できます。

シングルコード・プロファイラーとは異なり、C/C++、Fortran、Python*、Go*、Java* が混在したコードの hotspot を正確に特定します。

詳細・新機能 技術情報

最新のプロセッサーのパフォーマンス解析

最新のプロセッサーのパフォーマンスを解析する場合、シングルスレッド・パフォーマンスを最適化するだけでは十分ではありません。ハイパフォーマンスなコードには、次のものが求められます。

  • 複数の CPU を利用するためのスレッド化とスケーラビリティー
  • 複数の FPU を効率良く使用するためのベクトル化
  • NUMA とキャッシュを利用するためのチューニング

メディア・アプリケーションでは、OpenCL* と GPU のチューニングも必要になります。インテル ® VTune™ Amplifier では、これらの高度なプロファイル機能をフレンドリーな 1 つのインターフェイスから利用できます。

インテル ® Parallel Studio XE の解析ツール、ランタイム、 コンパイラーとの連携

インテル ® VTune™ Amplifier は、インテル ® Parallel Studio XE に含まれる次の解析ツールと連携可能です。

インテル ® Advisor

ベクトル化の最適化とスレッドのプロトタイプ生成に役立ちます。

インテル ® Trace Analyzer & Collector

MPI アプリケーションを検証し、スレッド化より最も大きな利点が得られるループをインテル ® VTune™ Amplifier に知らせます。

製品紹介資料

インテル ® Parallel Studio XE

製品概要、新機能、各エディションの違いやコンポーネント、パフォーマンス、お客様の声などをご紹介しています。

PDF ブラウザで表示

ライセンス

特定ユーザーライセンス、フローティング・ライセンスが提供されています。
ライセンス規定の詳細はライセンスページを参照ください。

特定ユーザーライセンス

特定の一個人に製品を使用する許可を与えます。

フローティング・ライセンス

同時に利用するマシン数が購入ライセンス数を超えない限り、複数台のマシンに製品をインストールし、利用することができます。

  • 現在 1-Pack ライセンスのみ販売
ライセンス詳細

OS

Windows および Linux

バージョン 2017 以前のインテル ® VTune™ Amplifier 製品では、Windows、Linux 各ホスト OS 向けのライセンスを販売しておりましたが、インテル社の意向により、2017年 9月 14日のバージョン 2018 リリースより、Windows、Linux 両 OS でご利用いただける「OS 共通製品」へと変更されました。
また、製品名についても、インテル ® VTune™ Amplifier XE for Windows および for Linux から、「インテル ® VTune™ Amplifier」 へと変更されました。

この変更により、これまでのインテル ® VTune™ Amplifier for Windows または for Linux (各ホスト OS 向け製品) をお持ちのお客様が、サポートサービスの更新を希望される場合には、特別アップグレード製品を購入いただくことにより、OS 共通ライセンスへアップグレードいただく必要がございます。 詳しくは こちらのページをご覧ください。

製品一覧

製品 OS ライセンス
インテル ® VTune Amplifier Windows および Linux 両 OS 向け共通ライセンス (バージョン 2018 以降) 特 / フ
  • 特: 特定ユーザーライセンスフ: フローティング・ライセンス

スイート製品に同梱

単体販売のほか、以下製品にも同梱されます。

インテル ® Parallel Studio XE

アプリケーションの高速化、安定化を支援するスイート製品です。Professional Edition 以上にインテル ® VTune™ Amplifier が同梱されます。

インテル ® Media Server Studio

ハイパフォーマンスで高品質なエンタープライズ・ グレードのメディア・ソリューション開発を支援するスイート製品です。Professional Edition にインテル ® VTune™ Amplifier が同梱されます。

インテル ® System Studio

組込み/モバイルデバイス向けシステムの電力効率、パフォーマンス、信頼性向上を支援するスイート製品です。Professional Edition 以上にインテル ® VTune™ Amplifier for Systems が同梱されます。

  • インテル ® VTune™ Amplifier
    Windows* と Linux* アプリケーションのパフォーマンスをプロファイルします。
  • インテル ® VTune™ Amplifier for Systems
    組込みターゲットのプロファイルをします。バッテリー駆動のシステム向けエネルギー・プロファイラーが含まれます。

バージョン 2018 新機能

主に以下の変更・機能が追加されました。
詳細は、 リリースノートを参照ください。

  • 共有および分散メモリー・アプリケーションのメトリックを素早く取得

  • コンテナーの内部もプロファイル

  • MPI メトリックの拡張: インバランスとクリティカル・パス・ランクを含む

  • アプリケーション・スナップショット: MPI と OpenMP* データの統合と MPICH サポートを追加

  • コンテナー内のプロファイルおよび実行中の Java* サービス/デーモンへのアタッチ

  • Python* のプロファイル: スレッド/メモリー使用量の解析を追加

  • OpenCL* カーネル hotspot 解析: カーネルのボトルネックを特定

  • マルチ OS: サポートするすべての Windows* および Linux* オペレーティング・システムでデータを収集および解析が可能 (OS 共通ライセンス化)

最初にチューニングすべきことは?
多くの時間を費やしているコードを素早く特定

hotspot 解析結果では、多くの CPU 時間を費やしている関数のリストがソートして表示されます。これにより、チューニングによって最大の効果が得られる箇所を確認できます。[+] をクリックするとコールスタックが表示され、ダブルクリックで該当するソースコードが表示されます。

結果を素早く解析 – プロファイルデータをソース上に表示

関数リストをダブルクリックすると、関数で最も時間を費やしているソースコード内の該当箇所に移動します。

C/C++、Fortran、Python*、Go*、Java* 混合コードをプロファイル

シングルコード・プロファイラーとは異なり、C/C++、Fortran、Python*、Go*、Java* が混在したコードの hotspot を正確に特定します。

最新プロセッサー上でパフォーマンスを発揮する 3 つのポイントを参照

最新ハードウェアのパフォーマンスを発揮するための 3 つの重要な要素の概要を取得するには、新しい HPC パフォーマンスの特徴付けを使用します: CPU 使用率(スレッド)、メモリーアクセス、および FPU 使用率 (FLOPS)。それから、各要素に対して、詳細な分析をドリルダウンします。

マルチコアの世界ではスレッドのパフォーマンスが重要な課題

インテル ® VTune™ Amplifier は、インテル ® TBB、OpenMP* などのスレッド化モデルをサポートします。タスクの開始/終了、同期、待機時間などマルチスレッドの概念を簡単に理解することができます。待機時間を確認する "Lock & Wait" 解析 (次にあるイメージ) は便利な機能の 1 つです。タイムラインの可視化 (以下の 2 番目のイメージ) では、ロック競合 (黄色のトランジション)、負荷インバランス、そして不用意なシリアル化など、並列処理のパフォーマンスを低下させるすべての原因を容易に検出できます。

"locks and waits" 解析で遅いスレッドのコードの一般的な原因を特定

ロックでの長時間の待機は、待機中のコアが十分に活用されず、並列プログラムのパフォーマンスを低下させる一般的な原因となります。"basic hotspots" と "locks & waits" プロファイルは、インテルおよび互換プロセッサーの両方で動作するソフトウェア・コレクターを利用しています。

素早く結果を確認可能 – タイムラインのフィルター処理で必要なデータを得る

タイムラインで time range を選択し、情報をマスクして必要なデータをフィルターする (例えばアプリケーションの起動時間)。タイムラインを選択してフィルターすると、選択された範囲のグリッドの CPU 時間を多く消費している 関数リストが更新されます。黄色の線は低速なトランジションです。過度のトランジションは、ロック競合と低い並列パフォーマンスを示すことがあります。スピンロックの問題を診断するため CPU 時間のマークを無効にする – スレッドが実行中もしくは待機中の時間だけを表示し、必要のないシリアル化を特定します。

リモートシステムを簡単にプロファイル – ライセンスはホストのみに必要で、ターゲットには不要

現在のホストまたはリモートシステム上で簡単にデータを収集できます。もしくは、リモートシステム上でコマンドラインを使用してデータを収集し、その後ホストでインポートしてローカルでデータを解析できます。

ヒント: 最適なパフォーマンスを達成するには、VNC スロー・グラフィックスは避けましょう。UI をローカルで実行してください。リモートターゲットからデータをインポートしましょう。リモートシステムへのインストールとデータの収集にはライセンスは必要ありません。ライセンスは、収集したデータを分析もしくは表示する場合にのみ必要です。リモートデータ収集については、 こちらの iSUS の記事もご覧ください。

ドライバーをチューニング。低いオーバーヘッドで高い精度を得る

インテル ® プロセッサーは、オンチップのパフォーマンス・モニタリング・ユニット (PMU) を搭載しています。インテルおよび互換プロセッサーで動作する "basic hotspots" 解析に加え、インテル ® VTune™ Amplifier には、インテル ® プロセッサー上のパフォーマンス・モニタリング・ユニット (PMU) を使用した非常にオーバーヘッドの少ない収集を行う "advanced hotspots" があります。システム全体の解析では、ドライバーも分析できます。高解像度 (~1 ミリ秒対 ~10 ミリ秒) で小さな関数中のホットスポットを検出できます。

"あらかじめプリセットされた" バンド幅とメモリー解析で簡単にセットアップ

あらかじめプリセットされたプロファイルで、簡単に解析の設定が可能。複雑なイベント名を覚えることなく、バンド幅をチューニングしキャッシュ効率を最適化できます。

パフォーマンスが向上する可能性がある箇所をハイライト

ピンク色にハイライト表示された項目は、チューニングでパフォーマンスが向上する可能性がある事を示します。マウスオーバーすることでチューニングのためのアドバイスが表示されます。

簡単で、より効率良い OpenMP* と MPI マルチランクのチューニング

サマリーレポートは、効率良く OpenMP* のパフォーマンスを改善するための上位 4 つの問題を表示します。リンクをクリックすると詳しい情報を取得できます。

OpenMP* のパフォーマンスをどのように改善できるか素早く参照可能

それぞれの OpenMP* 領域のチューニングでパフォーマンスが向上する可能性をハイライトします。例えば、参考画面のイメージでは、バランスを調整することで 34% 高速になる可能性があります。

MPI + OpenMP* のマルチランクを簡単に解析

インテル ® VTune™ Amplifier のサマリー表示には、改善された OpenMP* パフォーマンスによって、パフォーマンスが向上する上位の MPI ランクのテーブルがまとめられています。

MPI と OpenMP* のハイブリッド・アプリケーションでは、ランク間の MPI 通信とともに OpenMP* が非効率である部分を探すことが重要です。少ない通信スピン時間で多くのランクが実行され、そしてより多くの OpenMP* チューニングがアプリケーションの実行時間に影響します。MPI のチューニングには、 インテル ® Trace Analyzer & Collector を使用し、通信スピン時間が低いランクを選択してインテル ® VTune™ Amplifier で分析します。インテル ® VTune™ Amplifier はクラスターにインストールできます。

ストレージデバイス解析 (HDD、SATA または NVMe SSD)

I/Oバウンドまたは CPU バインドが起こっていますか? I/O 操作(非同期および同期)と計算の間のインバランスを調査しましょう。 CPU が I/O を待っているときに、ソースコードにマッピングされたストレージアクセスを参照してください。

使いやすい OpenCL™ と GPU プロファイル – Windows* と Linux で利用可能!

新しいプロセッサー上で OpenCL* をチューニングする場合、GPU アーキテクチャーのダイアグラムによって GPU ハードウェアのメトリックを簡単に確認することができます。

GPU とプラットフォームのデータを解析

最新のプロセッサーでは、必要に応じて OpenCL* とメディア・アプリケーション向けの GPU とプラットフォーム・データを収集できます。GPU/CPU アクティビティーを関連付けることが可能です。

特殊なコンパイラーやビルドは不要

低オーバーヘッドの収集は、データの精度を高めます。

コマンドラインを使用して自動化

コマンドライン・ツールを使用して回帰テストを自動化できます。また、簡単にリモート収集を行うためリモートシステムに軽量コンポーネントをインストールできます。

システム全体の解析

ドライバー、カーネルモデル、そしてマルチプロセス・アプリケーションをチューニング。

Microsoft* DirectX* フレームの自動識別

Windows* ゲーム中の低速な部分は? 開発者は、ゲーム中で時間がかかりフレームレートの低い場所を特定するために多くの時間を費やす必要はありません。インテル ® VTune™ Amplifier を使うことで、Microsoft* DirectX* のフレームを自動的に認識し、遅いフレームで何が起こっているかを見るためのフィルター処理が可能です。DirectX* を使用していない場合は? 時間がかかる場所に API を追加してフレーム解析を行うことで、遅延を解析することができます。

低オーバーヘッドの Java* プロファイル

Java* コードもしくは Java* とネイティブ・コードが混在したコードの解析結果を元の Java* のソースにマッピングします。インストルメント・コードを使用するほかの Java* プロファイラーとは異なり、インテル ® VTune™Amplifier は、ハードウェアとソフトウェア収集による低オーバーヘッドの統計的なサンプリングを行います。ハードウェアによる収集は、プロセッサーのパフォーマンス・モニター・ハードウェアを使用するため、非常に低オーバーヘッドです。

ユーザータスクの解析

タスク・アノーテーション API は、インテル ® VTune™ Amplifier が実行されたタスクを表示できるよう、ソースに注釈をつけるために使用されます。例えば、パイプラインのステージに API でラベルを付け、タイムラインに表示させることで、領域の詳細を明らかにします。これにより、プロファイルされたデータが分かりやすくなります。

インテル ® Xeon Phi™ 製品向けのチューニング

ハードウェア・プロファイルはインテル ® Xeon Phi™ 製品でもサポートされ、ホストの GUI 環境から起動できます。"Advenced Hotspots" と高度なイベントデータを収集し、複数のカード間にまたがって相互関係を時間マーカーで示すことができます。

本ページに、ドキュメント一覧が表示されない場合は、ご利用のブラウザの JavaScript を ON にしていただくか、 こちらのドキュメント・ページをご覧ください。

HPC アプリケーションに役立つハイパフォーマンス解析

このセッションは、インテル ® デベロッパー・ゾーンに公開されている「 HPC Applications Need High-Performance Analysis」の日本語版です。

このセッションでは HPC の分野に特化したパフォーマンス解析技術を性能解析ツール「インテル ® VTune™ Amplifier 」を使用してご紹介します。
まず最初に、現在の HPC 業界における一般的なパフォーマンス解析の状況をご紹介します。そして次に、インテル ® VTune™ Amplifier に搭載される HPC Performance Characterization (HPC 特性解析) について、その概要を説明します。これは、HPC アプリケーションのパフォーマンス特性を解析する機能となります。 さらに、HPC 特性解析を使用したパフォーマンス解析の例もご紹介します。

HPC アプリケーションに役立つハイパフォーマンス解析

製品トレーニング

  1. 製品概要
  1. Hotspot 解析
  1. Concurrency (コンカレンシー) 解析
  1. Locks & Waits (ロックと待機) 解析
  1. Advanced Hotspots 解析 (前編)
  1. Advanced Hotspots 解析 (後編)

製品セミナーや関連イベントをご紹介。

米インテル社の製品情報を日本語に翻訳して公開中。

アプリケーションの高速化、安定化を支援するスイート製品です。

ハイパフォーマンスで高品質なエンタープライズ・ グレードのメディア・ソリューション開発を支援するスイート製品です。

組込み/モバイルデバイス向けシステムの電力効率、パフォーマンス、信頼性向上を支援するスイート製品です。

マルチスレッド化、ベクトル化のアドバイスツールです。

クラスターシステムの性能解析ツールです。

世界最大規模のクラスターユーザーの 70% が活用しているデバッガー & プロファイラーです。

プロセッサー
  • インテル ® Streaming SIMD Extension 2 (インテル ® SSE2) 命令をサポートする IA-32 または インテル ® 64 アーキテクチャー・ベースのプロセッサー
  • 機能を最大限に活用できるよう、マルチコアまたはマルチプロセッサー・システムの使用を推奨します。
ホスト OS

Linux* と Windows*、macOS* で利用できます。

  • Microsoft* Windows* 7、8、8.1 および 10 (Windows 10 Creator Update (RS2) を含む)
  • Microsoft* Windows Server 2012 および 2016
  • Microsoft Windows* Embedded Standard 7、8.x
  • Microsoft Windows* Embedded Pro 8.x
  • Microsoft Windows* Embedded Industry 8.x
  • Red Hat* Enterprise Linux 6 および 7
  • CentOS* (上記 Red Hat* Enterprise Linux* バージョンと同等のバージョン)
  • SUSE* Linux* Enterprise Server (SLES) 11 および 12
  • Fedora* 25 および 26
  • Ubuntu* 14.04、16.04 および 17.04
  • Debian* 8.0 および 9.0
  • OS X* 10.11.*
  • macOS* 10.12.*
ターゲット OS

Windows*、Linux*、Android*、Tizen*、Wind River Linux* および Yocto Project*

開発環境

スタンドアロン、下記の Microsoft* Visual Studio* バージョン (Windows*)、Eclipse* 統合環境

  • Microsoft* Visual Studio* 2012
  • Microsoft* Visual Studio* 2013
  • Microsoft* Visual Studio* 2015 (Update 2、Update 3含む)
  • Microsoft* Visual Studio* 2017 (インテル ® VTune™ Amplifier XE 2017 Update 3 以降)
コンパイラー

下記のインテル ® コンパイラー、そのほか標準に準拠するコンパイラーで動作します。

  • インテル ® C/C++ コンパイラー 11 以上
  • インテル ® Fortran コンパイラー 11 以上
  • インテル ® Parallel Composer
  • Microsoft* Visual Studio* C/C++ コンパイラー (Windows*)
  • Cygwin (Cygwin 1.7.17 と GCC 4.5.3 でテスト済み)
  • MinGW (tested MinGW と GCC 4.6.2 でテスト済み)
  • GNU C/C++ コンパイラー 3.4.6 以上 (Linux*)
言語

C、C++、C#、Fortran、Java*、OpenCL*、Python*、Go™

スレッド化モデル: 完全なスレッド情報

OpenMP*、インテル ® スレッディング・ビルディング・ブロック (インテル ® TBB)、Win32* スレッド (Windows*)、Posix* Threads (Linux*)、Intel's C/C++ Parallel Language Extensions

  • 最新の情報は、製品または評価版に同梱されているリリースノートを参照ください。

お知らせ

2017年 9月 14日、インテル ® VTune™ Amplifier 2018 の販売を開始しました。

過去に製品をご購入いただき、現在有効なサポートサービスをお持ちのお客様は、すぐにバージョン 2018 を無料でダウンロードしてご利用いただけます。

バージョン 2017 以前のインテル ® VTune™ Amplifier 製品では、Windows、Linux 各ホスト OS 向けのライセンスを販売しておりましたが、インテル社の意向により、2017年 9月 14日のバージョン 2018 リリースより、Windows、Linux 両 OS でご利用いただける「OS 共通製品」へと変更されました。
また、製品名についても、インテル ® VTune™ Amplifier XE for Windows および for Linux から、「インテル ® VTune™ Amplifier」 へと変更されました。

この変更により、これまでのインテル ® VTune™ Amplifier for Windows または for Linux (各ホスト OS 向け製品) をお持ちのお客様が、サポートサービスの更新を希望される場合には、以下いずれかの特別アップグレード製品を購入いただくことにより、OS 共通ライセンスへアップグレードいただく必要がございます。


  • インテル ® VTune™ Amplifier 特別アップグレード (OS 共通ライセンスへのアップグレード)

  • インテル ® VTune™ Amplifier for Windows または for Linux (各 OS 向け製品) のサポートサービスが有効な場合、本特別アップグレードをご購入いただくことで、OS 共通ライセンスへアップグレードいただけると共に、インテル ® VTune™ Amplifier のサポートサービス更新用製品「SSR (期限内更新用)」よりも安価にて、サポートサービスの期間を 1 年間延長いただけます。詳しくは こちらのページをご覧ください。


  • インテル Parallel Studio XE への特別アップグレード

    インテル ® VTune™ Amplifier OS 共通ライセンスを含む上位製品へのアップグレードです。詳しくは こちらのページをご覧ください。

FAQ

基本的な hotspot (以前の「hotspot」)

  • ソフトウェア・コレクターを使用します。
  • ドライバーは必要ありません。
  • インテル ® プロセッサーおよび互換プロセッサーで利用できます。
  • 分解能は ~10 ミリ秒。
  • コールスタックを収集して呼び出しシーケンスを表示します。
  • 仮想環境で動作します。

高度な hotspot

  • ハードウェア・コレクターおよびオンチップのパフォーマンス・モニタリング・ユニットを使用します。
  • インストールに管理者権限が必要なソフトウェアに含まれるドライバーが必要です。
  • 収集にはインテル ® プロセッサーが必要です。
  • 分解能は ~1 ミリ秒 (より小さな関数を検出できます)。
  • 最適なコールスタック収集。
  • VM ベンダーでサポートされている場合のみ仮想環境で動作します (VMware vSphere* 5.1 など)。

はい。インテル ® VTune Amplifier は、インテルの命令セットを含むアプリケーションを解析する場合、インテル ® プロセッサーと互換プロセッサーの両方で動作します。ソフトウェア・コレクターを使用するプロファイル機能 (「基本的な hotspot」および「ロックと待機」など) は、インテル ® プロセッサーと互換プロセッサーの両方で動作します。ハードウェア・コレクターおよびオンチップのパフォーマンス・モニタリング・ユニットを使用するプロファイル機能 (「高度な hotspot」および「マイクロアーキテクチャー解析」など) は、データ収集にはインテル ® プロセッサーが必要ですが、収集後の結果は互換プロセッサーで解析できます。

いいえ。インテル ® VTune Amplifier でプロファイルを行うために再コンパイルする必要はありません。しかし、最も完全で有用な結果が得られるように、最適化されたアプリケーションでデバッグおよびシンボル情報を有効にすることを推奨します。このため、リリースビルドのプロセスはデバッグ情報を追加するように修正する必要があります。

» マニュアルはこちら

いいえ。製品を入手した後、CLI インストーラー (コマンドライン・インストーラー) から同じ OS のほかのシステムでのデータ収集を設定できます。リモートシステムでは、データの収集はできますが、収集したデータの表示にはライセンスが必要です。データを表示するには、製品をインストールしたシステムに結果ディレクトリーをコピーします。詳細については、ドキュメントの「Remote Tuning Workflow (リモート・チューニング・ワークフロー)」を参照してください。インストールの詳細については、リリースノートの「リモートシステムでのコレクターのインストール」を参照してください。

インテル ® VTune Amplifier にソースコードが表示されない理由はいくつかあります。

ソースコードを表示するには、デバッグ情報が利用可能になるようにコードをコンパイルする必要があります。例えば、Linux* では、"-g" オプションを指定してコンパイルしていることを確認します。

インテル ® VTune Amplifier にソースファイル、バイナリーファイル、シンボルファイルの場所を知らせる必要もあります。既存のプロジェクトを開くか新規プロジェクトを作成して、[Project Properties (プロジェクト・プロパティー)] ボタンをクリックします。[Project Properties (プロジェクト・プロパティー)] ダイアログで、[Search Directories (検索ディレクトリー)] タブをクリックします。プルダウンメニューで、[All files (すべてのファイル)] をクリックして、ファイルが含まれているディレクトリーを指定します。サブディレクトリーが含まれる場合は、[Search subdirectories (サブディレクトリーを検索)] ボックスをオンにします。

いいえ。Linux* では、ハードウェア・コレクターのドライバーをインストールするには root 権限が必要ですが、ドライバーをインストールした後は root 権限は必要ありません。プリインストールされる perf ドライバーを使用することもできますが、perf では一部の機能はサポートされていません。Linux* では、ハードウェア・コレクターを使用するには、ドライバー・アクセス・グループ (デフォルトは 'vtune') に属している必要があります (選択されるインストール・オプションに依存します)。ハードウェア・コレクターは、高度な hotspot 解析や高度な解析に使用されます。詳細については、ドキュメントの「Installing the Sampling Driver (サンプリング・ドライバーのインストール)」を参照してください。

ハードウェアベースの (「高度な」) サンプリング解析タイプではプロセッサーのパフォーマンス・モニタリング・ユニット (PMU) との通信が必要になるため、インストーラーはデバイスドライバーをインストールしようとします。Windows ® では、ドライバー (署名されています) をインストールするユーザーは管理者グループに属している必要があります。Linux* では、ドライバーをインストールするユーザーは、root ユーザーまたは sudo を利用可能なユーザーである必要があります。Linux* ユーザーは、デバイスドライバーなしでソフトウェアをローカルにインストールして、ユーザーモード・サンプリング解析タイプ (基本的な hotspot、コンカレンシー、ロックと待機) を使用できます。ユーザーはプリインストールされる perf ドライバーを使用することもできますが、perf では一部の機能はサポートされていません。ユーザーが root としてソフトウェアをインストールできる場合、ハードウェアベースのサンプルを収集するユーザーは、インストール中に定義されるユーザーグループに属している必要があります (インストール中に選択されるオプションに依存します)。デフォルトは 'vtune' グループですが、インストーラー (install.sh) の高度なオプションにアクセスして変更または省略することができます。

結果をインテル ® VTune Amplifier にインポートするには、最初にインポートする結果を含めるプロジェクトを作成する必要があります。インテル ® VTune Amplifier で、[File (ファイル)] > [New (新規)] > [Project (プロジェクト)] メニューをクリックします。プロジェクト名を指定するダイアログが表示されます。プロジェクト名を指定して、[OK] をクリックします。インテル ® VTune Amplifier の [Project Properties (プロジェクト・プロパティー)] ダイアログが表示されます。結果をプロジェクトへインポートするときにアプリケーションを指定する必要はありません。しかし、インポートした結果のソースを表示する場合は、ソースおよびバイナリーの場所を検索ディレクトリーに追加する必要があります。[Project Properties (プロジェクト・プロパティー)] ダイアログで、[Search Directories (検索ディレクトリー)] タブをクリックします。プルダウンメニューで、[All files (すべてのファイル)] をクリックして、ファイルが含まれているディレクトリーを指定します。サブディレクトリーが含まれる場合は、[Search subdirectories (サブディレクトリーを検索)] ボックスをオンにします。

検索ディレクトリーは、通常はデータ収集が完了した後に行われるファイナライズ中に使用されます。新しい検索ディレクトリーのパスを有効にするには、提供される新しい情報を使用してインテル ® VTune Amplifier で結果を再解決する必要があります。[Analysis Type (解析タイプ)] タブをクリックした後、[Start (スタート)] ボタンおよび [Project Properties (プロジェクト・プロパティー)] ボタンの下にある [Re-resolve (再解決)] ボタンをクリックします。

サンプルカウントは、実行可能なコードと通常関連付けられていないソース行 ('for' ループや 'while' ループの閉じ括弧など) に表示されることがあります。間違っているように見えるかもしれませんが、これはコンパイラーによって生成された命令の結果です。アセンブリー・コードを見ると、そのソース行に属するものとしてタグ付けされた (閉じ括弧)、サンプルが関連付けられたアセンブリー命令のデバッグ情報を明らかにすることができます。一方で、アセンブリー命令を見ると、特定のハードウェア・イベントが本来そのイベントを生成しない命令で収集されることがあります (例えば、ジャンプ命令のメモリーイベントやメモリー命令の算術イベント)。これは「イベントスキッド」と呼ばれ、命令ポインターをサンプリングする前にプロセッサーがいくつかのマイクロオペレーションを停止できないことが原因です。つまり、サンプルを処理している間に命令ポインターが後の命令を指してしまうのです。一般に、命令フローを調べることにより、そのイベントの原因となった命令を判断することができます。

アプリケーションが I/O をブロックしている場合、ファイルアクセスに起因する関数呼び出しが基本的な hotspot 解析に表示されます。また、1 つのファイルへのアクセスを待つ複数のスレッドがある場合、ファイルを保護する同期オブジェクト (クリティカル・セクションなど) がロックと待機解析に表示されます。

インテル ® レジストレーション・センターで操作します。
操作手順やよくあるご質問、トラブルシューティングは、インテル ® レジストレーション・センター操作マニュアルを参照ください。

» マニュアルはこちら

最新版、または旧バージョンのダウンロードは、インテル ® レジストレーション・センターで行います。
詳細は以下ページを参照ください。

» 製品登録 & ダウンロード

購入

技術情報

サポート