ドキュメント

インテル® ソフトウェア開発製品のカタログ、製品ドキュメント、参考資料、評価用資料を提供します。
関連情報
[お知らせ一覧]

インテル® ソフトウェア開発製品 総合カタログ

【Vol.13 掲載内容】

  • 高速な C/C++、Fortran、Python アプリケーションを開発 - インテル® Parallel Studio XE 2019 の新機能、コンパイラーのベンチマークを掲載
  • ビデオ解析、エンコード & デコードを高速化 - インテル® Media Server Studio
  • 革新的な組込みソリューションを迅速に開発 - インテル® System Studio
  • サーバー管理、キャッシュ・ソリューションなどのデータセンター向け製品
  • インテル® Parallel Studio XE 製品別機能比較表

インテル® Parallel Studio XE バージョン 2019 の新機能、対応する言語規格、各コンポーネントの紹介、各エディションの機能比較情報などをご紹介しています。HPC、ディープラーニング、組込み、ビデオ解析向けのアプリケーション開発・分析ツールに加え、キャッシュ・ソリューション、サーバー監視、管理に役立つデータセンター向け製品も掲載しております。

バックナンバー

総合カタログ Vol.12 インテル® Parallel Studio XE 2018 など PDF
総合カタログ Vol.11 インテル® Parallel Studio XE 2017 など PDF
総合カタログ Vol.8 インテル® Parallel Studio XE 2015 など PDF
総合カタログ Vol.6 インテル® Parallel Studio XE 2013 など PDF

エクセルソフト取り扱い製品の総合カタログはこちら

  • 総合カタログのブラウザ表示版は aXmag ePublisher を使用して作成しています。

製品別カタログ

C/C++、Fortran アプリケーション開発向け

インテル® Parallel Studio XE C/C++、Fortran アプリケーション開発向けツールスイート PDF
インテル® VTune™ Amplifier パフォーマンス/スレッド・プロファイラー PDF

メディア・アプリケーション開発向け

インテル® Media Server Studio メディア・アプリケーション開発向けツールスイート PDF

組込みシステム/モバイル開発向け

インテル® System Studio 組込み / モバイルシステム開発向けツールスイート PDF
インテル® XDK (英語) クロスプラットフォーム対応の HTML5 アプリケーション開発ツール【無料】 PDF

データセンター向け

インテル® Cache Acceleration Software データセンター向け SSD ストレージのキャッシュ・ソリューション PDF
インテル® データセンター・マネージャー データセンターやサーバールームの電力や温度を監視・管理 PDF
インテル® Virtual KVM リモートのデータセンターのハードウェアへ安全なアクセスとトラブルシューティングを提供 PDF

製品紹介資料

インテル® Parallel Studio XE 2019 ブラウザで表示 / PDF
インテル® Media Server Studio 2018 ブラウザで表示 / PDF
インテル® System Studio 2018 ブラウザで表示 / PDF

製品旧バージョンの紹介資料

インテル® コンパイラー 17.0 ブラウザで表示 / PDF
インテル® VTune™ Amplifier 2015 ブラウザで表示 / PDF
インテル® 解析ツール 2015 ブラウザで表示 / PDF
インテル® MPI ライブラリー 5.0 ブラウザで表示 / PDF
インテル® Trace Analyzer & Collector 9.0 ブラウザで表示 / PDF
  • 製品紹介資料のブラウザ表示版は iSpring 製品 を使用してパワーポイントから作成しています。 iSpring
インテル® レジストレーション・センター操作マニュアル おすすめ
インテル® レジストレーション・センターの基本的な操作手順や、よくあるご質問、報告されているトラブルをまとめています。例えば以下のような事項を説明します。
  • 製品の登録、ダウンロード方法
  • ライセンスファイルの取得方法
  • ユーザー情報、メールアドレス変更方法
説明 PDF
フローティング・ライセンス管理用ライセンス・マネージャー リリースノート
フローティング・ライセンスを管理するライセンス・マネージャーの概要、新機能、既知の問題などが記載されています。
説明 WEB
フローティング・ライセンス管理用ライセンス・マネージャー導入ガイド

フローティング・ライセンスを管理するライセンス・マネージャーの導入方法を説明します。

PDF/WEB
v2.4 / v2.6 以降 (英語)

説明
フローティング・ライセンス管理用ライセンス・マネージャーの使用 (英語)
フローティング・ライセンスを管理するライセンス・マネージャーの使用方法を説明します。

PDF/WEB
v2.4 / v2.6 以降

説明
インテル® FLEXlm* License Manager FAQ
WEB
複数のフローティング・ライセンスの管理
複数のフローティング・ライセンスを同一サーバーで管理する場合について説明します。
説明 PDF
新旧製品名対応表
名称が変更された製品の新旧名称の比較表です。
説明 WEB
Intel® Software Documentation Library (英語)
米インテル社の製品ドキュメント掲載サイトです。
説明 WEB

バージョン 2019

製品カタログ
PDF
製品紹介資料
インテル® Parallel Studio XE 2019 や同梱されるコンポーネントの新機能、各エディションの違いやパフォーマンス、お客様の声などをご紹介しています。
PDF
リリースノート
製品概要 (新機能、製品内容を含む)、動作環境、既知の制限事項が記載されています。
説明
リリースノート (インテル® コンパイラー 19.0)
リリースノートには、本バージョンで追加された新機能をはじめ、動作環境、変更点等が記載されています。
説明
インストールガイド (Composer Edition for Fortran Windows)
インテル® Parallel Studio XE 2019 Composer Edition for Fortran Windows 製品をインストールするにあたり、必要な下記の情報・手順を、画面スクリーンショットと共に分かり易く紹介しています。
  • 製品に含まれるコンポーネント
  • 動作環境
  • 製品パッケージとライセンスファイルのダウンロード
  • インストール前の準備
  • 製品のインストール
  • FAQ –よくある質問、トラブルシューティング
説明 PDF
ゲッティング・スタート・ガイド (英語)
製品ドキュメントや情報へのリンクを集めた Intel 社の Web ページです。
説明
インテル® C++/Fortran コンパイラー 19.0 デベロッパー・ガイドおよびリファレンス
インテル® C++/Fortran コンパイラー 19.0 の以下事項について説明します。
  • コマンドラインまたは IDE からコンパイラーを起動する方法
  • OpenMP* サポート
  • インテル® MIC アーキテクチャー
  • コンパイラー・オプション
  • インテル® グラフィックス・テクノロジー (C++ のみ)
  • 組込み関数 (C++ のみ)
  • プラグマ (C++ のみ)
  • 構文やセマンティクス、さまざまな Fortran 標準への準拠、および各種標準の拡張に関する情報 (Fortran のみ、英語)
  • Fortran 言語拡張 (Fortran のみ)
  • 言語が混在したプログラミング (Fortran のみ)
  • ランタイム・エラー・メッセージのリスト (Fortran のみ)

※インテル® C++/Fortran コンパイラー 19.0 のデベロッパー・ガイドおよびリファレンス 日本語版は、2018年 第 4 四半期に公開を開始する予定です。

説明

バージョン 2018

製品カタログ
PDF
製品紹介資料
インテル® Parallel Studio XE 2018 や同梱されるコンポーネントの新機能、各エディションの違いやパフォーマンス、お客様の声などをご紹介しています。
説明 PDF
リリースノート
製品概要 (新機能、製品内容を含む)、動作環境、既知の制限事項が記載されています。
説明
リリースノート (インテル® コンパイラー 18.0)
リリースノートには、本バージョンで追加された新機能をはじめ、動作環境、変更点等が記載されています。
説明
インストールガイド (全エディション共通、英語)
インストーラー、フォルダ構成などインストール関連の情報について説明します。
説明
インストールガイド (Composer Edition for Fortran Windows)
インテル® Parallel Studio XE 2018 Composer Edition for Fortran Windows 製品をインストールするにあたり、必要な下記の情報・手順を、画面スクリーンショットと共に分かり易く紹介しています。
  • 製品に含まれるコンポーネント
  • 動作環境
  • 製品パッケージとライセンスファイルのダウンロード
  • インストール前の準備
  • 製品のインストール
  • FAQ –よくある質問、トラブルシューティング
説明 PDF
入門ガイド (Composer Edition for Fortran Windows)

これからインテル® Parallel Studio XE 2018 Composer Edition for Fortran Windows 製品を使い始める方、使い始めたばかりの方や Visual Studio の操作に不慣れな方、最適化・並列化機能にご興味のある方向けの入門ガイドです。

Visual Studio からのコンパイル・実行・デバッグ手順、自動ベクトル化と自動並列化オプションの使い方とその効果、またスタック・オーバーフロー問題や、大規模配列の扱い方、実行時エラーの対処法など、その他 Tips などの情報も盛り込まれています。

  • コンパイル手順
  • デバッグ作業
  • 最適化オプションを使用したコンパイル
  • 関連情報 / お問い合わせ先 / 参考資料
説明 PDF
ゲッティング・スタート・ガイド (英語)
製品ドキュメントや情報へのリンクを集めた Intel 社の Web ページです。
説明
インテル® C++/Fortran コンパイラー 18.0 デベロッパー・ガイドおよびリファレンス
インテル® C++/Fortran コンパイラー 18.0 の以下事項について説明します。
  • コマンドラインまたは IDE からコンパイラーを起動する方法
  • OpenMP* サポート
  • インテル® MIC アーキテクチャー
  • コンパイラー・オプション
  • インテル® グラフィックス・テクノロジー (C++ のみ)
  • 組込み関数 (C++ のみ)
  • プラグマ (C++ のみ)
  • 構文やセマンティクス、さまざまな Fortran 標準への準拠、および各種標準の拡張に関する情報 (Fortran のみ、英語)
  • Fortran 言語拡張 (Fortran のみ)
  • 言語が混在したプログラミング (Fortran のみ)
  • ランタイム・エラー・メッセージのリスト (Fortran のみ)

デベロッパー・ガイドおよびリファレンス 日本語版
こちらのページから下記のいずれかの製品の評価版をご登録いただくことで、入手いただけます。

  • インテル® Parallel Studio XE Cluster Edition for Windows
  • インテル® Parallel Studio XE Cluster Edition for Linux

デベロッパー・ガイドおよびリファレンス 英語
下記のリンクより、英語版ガイドをご覧いただけます。

説明
コンパイラー最適化クイック・リファレンス・ガイド
インテル® コンパイラー 18.0 で使用できるオプションの一覧です。パフォーマンス解析ツール インテル® VTune™ Amplifier の機能紹介もございます。
説明 PDF
インテル® Advisor 2018 ベクトル化アドバイザー入門ガイド

インテル® Advisor 製品は、並列プログラミングを行う上で重要なベクトル化とスレッド化を支援するためのアドバイザー・ツールです。インテル® Advisor のベクトル化アドバイザーは、アプリケーションに実装されているループ処理、および関数を調査し、必要な情報を提供します。

本ガイドはインテル® Advisor のベクトル化アドバイザーに付属する C++ 言語のサンプルプログラムを使用して、ベクトル化アドバイザーから必要な情報を取得するための使用方法と、各画面の見方をチュートリアル形式で説明します。本チュートリアルでは以下のステップを実行します。

  1. 必要条件の設定
  2. インテル® Advisor の起動
  3. プロジェクトの作成と設定
  4. ベクトル化に関する情報を取得する
  5. ループ情報の詳細を取得する
  6. メモリー・アクセス・パターンを取得する
  7. データ間の依存性を解析する

説明 PDF
Intel 社 Webinar「インテル® Parallel Studio XE によりアプリケーション・パフォーマンスを大幅に向上」資料
インテル® Parallel Studio XE の製品概要、バージョン 2018 で新たに追加さえた新機能に加え、以下のトピックについて紹介された Webinar の資料を日本語化しました。
  • どこから開始すべきか?
  • 診断と実装のフローチャート
  • スレッドの問題
  • ベクトル化の問題
  • メモリー/ストレージの問題
  • クラスターのスケーラビリティー
  • デモ
説明 PDF
Intel 社記事「インテル® C++ コンパイラーを使用したパフォーマンスの最適化」
この記事は、2017年 12月 18日時点の、インテル® デベロッパー・ゾーンに公開されている「Step by Step Performance Optimization with Intel® C++ Compiler」の日本語訳です。
一般に、インテル ® C++ コンパイラーを使用したパフォーマンスの最適化には、次の 6 つのステップがあります。本記事でご紹介します。
  1. 最適化なしでコンパイルする
  2. 一般的な最適化を有効にする
  3. プロセッサー固有の最適化を有効にする
  4. IPO 最適化を使用する
  5. PGO 最適化を使用する
  6. 自動ベクトル化のチューニング
説明 PDF
Intel 社記事「ベクトル化とインテル® Xeon® スケーラブル・プロセッサーを使用したパフォーマンスの向上」
この記事は、2018 年 6 月 12 日時点の、インテル® デベロッパー・ゾーンに公開されている「Improve Performance Using Vectorization and Intel® Xeon® Scalable Processors」の日本語訳です。
ソフトウェアのパフォーマンスを高めるニーズは増加の一途を辿っていますが、以前のようにハードウェアのクロック速度を上げることでパフォーマンスを向上させることはできません。その代わりに、ソフトウェア・アプリケーションが複数のコアで並列処理を使用し、各コアで SIMD (Single Instruction、Multiple Data) アーキテクチャーやベクトル・プロセッサーにより増加した実行ユニットを活用する必要があります。本資料では、以下のトピックについて解説しています。
  1. ベクトル化の基本
  2. インテル® アドバンスト・ベクトル・エクステンション 512 (インテル® AVX-512): ベクトル処理能力を向上
  3. ベクトル化を先に行う
  4. 例: アメリカンオプションの価格計算
説明 PDF
Intel 社記事「Parallel STL 入門ガイド」
この記事は、2018 年 6 月 12 日時点の、インテル® デベロッパー・ゾーンに公開されている「Getting Started with Parallel STL」の日本語訳です。
Parallel STL は、一般に C++17 と呼ばれる C++ 標準の次期バージョンの Working Draft N4659 で指定されている、実行ポリシーをサポートする C++ 標準ライブラリー・アルゴリズム の実装です。この実装は、ISO C++ Working Group Paper P0076R3 で指定されている、順序関係が存在しない実行ポリシーもサポートしています。
Parallel STL は、インテル® プロセッサー向けアルゴリズムの並列実行とベクトル実行の両方を効率的にサポートします。シーケンシャル実行は、C++ 標準ライブラリーの利用可能な実装に依存します。インテル ® Parallel Studio XE およびインテル® System Studio の一部として利用できます。本資料では、以下のトピックについてステップに沿って解説しています。
  1. 使用のための準備
  2. Parallel STL の使用
  3. サンプル
  4. 実装されているアルゴリズム
説明 PDF
Intel 社 Webinar「インテル® コンパイラーの概要」資料
インテル® Parallel Studio XE 2018、インテル® System Studio 2018 に含まれるインテル® コンパイラー 18.0 の概要について以下のトピックに沿って紹介する Webinar の資料を日本語化しました。
  • インテル® コンパイラーを使用する理由
  • 高レベルの最適化
  • 最適化レポート
  • プロシージャー間の最適化 (IPO)
  • 自動ベクトル化
  • プロファイルに基づく最適化 (PGO)
  • 自動並列化
説明 PDF
Intel 社 Webinar「最小限の労力で最大限のパフォーマンスを得る:インテル® パフォーマンス・ライブラリー」資料
インテル® Parallel Studio XE に含まれるパフォーマンス・ライブラリーについて、各ライブラリーごとの概要やバージョン 2018 の新機能、パフォーマンス・ベンチマークなどが紹介された Webinar の資料を日本語化しました。
  • インテルは最新のインテル® プロセッサー向けにチューニングされたパフォーマンス・ライブラリーのコレクションを提供
  • インテル® MKL
  • インテル® IPP
  • インテル® TBB
  • インテル® DAAL
  • インテル® Distribution for Python*
説明 PDF

参考資料

iSUS 関連記事
iSUS (IA Software User Society) は、IA プラットフォーム向けにソフトウェアを開発する開発者向けのポータルサイトであり、インテル® ソフトウェア開発製品の技術記事が掲載されています。
説明
米インテル社製品ドキュメントページ (英語)
WEB
インテル® Xeon Phi™ コプロセッサー開発者向け特集ページ
インテル® Xeon Phi™ コプロセッサー関連のドキュメント、サンプルコード、導入事例をまとめています。
説明 WEB
導入事例
WEB
お客様の声
WEB
開発のヒント
WEB
並列化技術マガジン
WEB

バージョン 2019

製品カタログ (インテル® Parallel Studio XE およびそのコンポーネント)
PDF
製品紹介資料
インテル® Parallel Studio XE 2019 や同梱されるコンポーネントの新機能、各エディションの違いやパフォーマンス、お客様の声などをご紹介しています。
PDF
リリースノート
インテル® MKL ソフトウェア製品の新機能と注意事項についての概要が含まれています。
説明
デベロッパー・ガイド(英語)
ライブラリー構成、リンク方法に関する詳細情報と、その他関連情報を説明しています。
説明
ゲッティング・スタート・ガイド (英語)
製品ドキュメントや情報へのリンクを集めた Intel 社の Web ページです。
説明

バージョン 2018

製品カタログ (インテル® Parallel Studio XE およびそのコンポーネント)
PDF
製品紹介資料 (インテル® Parallel Studio XE およびそのコンポーネント)
インテル® Parallel Studio XE 2018 や同梱されるコンポーネントの新機能、各エディションの違いやパフォーマンス、お客様の声などをご紹介しています。
説明 PDF
インテル® VTune™ Amplifier Windows 環境向けスタートガイド おすすめ
このドキュメントでは、インテル® VTune™ Amplifier の概要と、製品に含まれるサンプルプログラムを使用して、以下の基本的な使用方法を説明します。短時間で基本の解析方法を理解することを目的とした入門ガイドです。
  • インテル® VTune™ Amplifier の起動方法
  • プロジェクトの作成、設定方法
  • 解析結果の表示と、解析画面の見方
  • ソースコードに掘り下げて解析結果を確認する方法
説明 PDF
リリースノート
インテル® MKL ソフトウェア製品の新機能と注意事項についての概要が含まれています。
説明
デベロッパー・ガイド
ライブラリー構成、リンク方法に関する詳細情報と、その他関連情報を説明しています。
説明
チュートリアル: インテル® MKL を使用した行列乗算
インテル® MKL を、アプリケーション内で実際にどのように使用するかをデモとともに説明しています。
説明
ゲッティング・スタート・ガイド (英語)
製品ドキュメントや情報へのリンクを集めた Intel 社の Web ページです。
説明
デベロッパー・リファレンス (英語)
このチュートリアルでは、インテル® MKL の数学関数を使用してアプリケーションのパフォーマンスを向上させる方法を説明します。
説明
Intel 社 Webinar「インテル® MKL を使用した小行列乗算の高速化」資料
インテル® MKL を使うことで、応用数学、物理学および工学で使用されるようなアプリケーションでの小行列乗算実行時のパフォーマンスを劇的に向上させることができます。このコース資料では、インテル® MKL 2018 の新機能の紹介やさまざまな行列乗算ユースケースを用いて、結果を比較していきます。

  • インテル® MKL の概要
  • インテル® MKL 2018 の新機能
  • 行列-行列乗算
  • 小行列のパフォーマンスの課題
  • 小行列のパフォーマンスを向上するインテル® MKL のソリューション
  • パフォーマンスのヒントと測定
  • サマリーおよびインテル® MKL 関連情報
説明 PDF
Intel 社 Webinar「最小限の労力で最大限のパフォーマンスを得る:インテル® パフォーマンス・ライブラリー」資料
インテル® Parallel Studio XE に含まれるパフォーマンス・ライブラリーについて、各ライブラリーごとの概要やバージョン 2018 の新機能、パフォーマンス・ベンチマークなどが紹介された Webinar の資料を日本語化しました。
  • インテルは最新のインテル® プロセッサー向けにチューニングされたパフォーマンス・ライブラリーのコレクションを提供
  • インテル® MKL
  • インテル® IPP
  • インテル® TBB
  • インテル® DAAL
  • インテル® Distribution for Python*
説明 PDF

参考資料

iSUS 関連記事
WEB
米インテル社製品ドキュメントページ (英語)
WEB
導入事例
WEB
開発のヒント
WEB
並列化技術マガジン
WEB

バージョン 2019

製品カタログ (インテル® Parallel Studio XE およびそのコンポーネント)
PDF
製品紹介資料
インテル® Parallel Studio XE 2019 や同梱されるコンポーネントの新機能、各エディションの違いやパフォーマンス、お客様の声などをご紹介しています。
PDF
リリースノート
インテル® IPP ライブラリー・ソフトウェア製品の新機能と注意事項についての概要が含まれています。
説明
インストール・ガイド (英語)
製品のシステム要件、インストーラーの入手先、インストール方法をご紹介しています。
説明
ゲッティング・スタート・ガイド (英語)
製品を使い始めるにあたり役立つ、基本的な情報をご紹介しています。
説明
ディベロッパー・ガイド (英語)
製品の機能をご紹介しています。
説明
チュートリアル: インテル® IPP 2019 による画像の回転とブラー (英語)
インテル® IPP の画像処理関数を使用してアプリケーションに画像の回転とブラーを実装する方法を説明します。
説明
ディベロッパー・リファレンス・ガイド (英語)
製品の機能が紹介されています。
説明

バージョン 2018

製品カタログ (インテル® Parallel Studio XE およびそのコンポーネント)
PDF
製品紹介資料 (インテル® Parallel Studio XE およびそのコンポーネント)
インテル® Parallel Studio XE 2018 や同梱されるコンポーネントの新機能、各エディションの違いやパフォーマンス、お客様の声などをご紹介しています。
説明 PDF
リリースノート
インテル® IPP ライブラリー・ソフトウェア製品の新機能と注意事項についての概要が含まれています。
説明
インストール・ガイド (英語)
製品のシステム要件、インストーラーの入手先、インストール方法をご紹介しています。
説明
ゲッティング・スタート・ガイド (英語)
製品を使い始めるにあたり役立つ、基本的な情報をご紹介しています。
説明
ディベロッパー・ガイド
製品の機能をご紹介しています。
説明
チュートリアル: インテル® IPP 2018 による画像の回転とブラー
インテル® IPP の画像処理関数を使用してアプリケーションに画像の回転とブラーを実装する方法を説明します。
説明
ディベロッパー・リファレンス・ガイド (英語)
製品の機能が紹介されています。
説明
Intel 社 Webinar「クラウドおよびエッジ・アプリケーション向けデータ圧縮コードの高速化」資料
ストレージスペースを節約し、通信効率を向上させるには、データの圧縮と解凍がますます重要になります。しかし、圧縮と復元には余分なプロセッサリソースが必要です。データ集約型アプリケーションでは、これがシステム全体のパフォーマンスに大きく影響します。圧縮アルゴリズムの最適化された実装は、システムパフォーマンスの影響を最小限に抑える上で重要な役割を果たします。
インテル ® IPP には、ZLIB、BZIP、および LZO を含む高度に最適化されたロスレス・データ圧縮機能の特殊なドメインが含まれています。インテル® IPP 2018 では、高速圧縮をサポートする LZ4 アルゴリズムも導入されています。

本コース資料では、以下のトピックについてご紹介しています。
  • インテル® IPP の概要
  • インテル® IPP 2018 の新機能
  • データ圧縮の使用例
  • インテル® IPP のデータ圧縮関数
  • アプリケーションに最適な圧縮アルゴリズムを選択する方法
説明 PDF
Intel 社 Webinar「最小限の労力で最大限のパフォーマンスを得る:インテル® パフォーマンス・ライブラリー」資料
インテル® Parallel Studio XE に含まれるパフォーマンス・ライブラリーについて、各ライブラリーごとの概要やバージョン 2018 の新機能、パフォーマンス・ベンチマークなどが紹介された Webinar の資料を日本語化しました。
  • インテルは最新のインテル® プロセッサー向けにチューニングされたパフォーマンス・ライブラリーのコレクションを提供
  • インテル® MKL
  • インテル® IPP
  • インテル® TBB
  • インテル® DAAL
  • インテル® Distribution for Python*
説明 PDF

参考資料

iSUS 関連記事
WEB
米インテル社製品ドキュメントページ (英語)
WEB
導入事例
WEB
開発のヒント
WEB
並列化技術マガジン
WEB

バージョン 2019

製品カタログ (インテル® Parallel Studio XE およびそのコンポーネント)
PDF
製品紹介資料
インテル® Parallel Studio XE 2019 や同梱されるコンポーネントの新機能、各エディションの違いやパフォーマンス、お客様の声などをご紹介しています。
PDF
リリースノート
製品の概要 (機能、製品内容を含む)、動作環境、既知の制限事項を説明します。
説明
ゲッティング・スタート・ガイド (英語)
製品を使い始める際の必要事項や、各種ドキュメントへのリンクなどが紹介されている Intel 社の Web ページです。
説明 WEB
ディベロッパー・ガイド/リファレンス・ガイド (英語)
インテル® TBB の各構文と意味に関する詳細な情報が参照できるように構成されています。
説明

バージョン 2018

製品カタログ (インテル® Parallel Studio XE およびそのコンポーネント)
PDF
製品紹介資料 (インテル® Parallel Studio XE およびそのコンポーネント)
インテル® Parallel Studio XE 2018 や同梱されるコンポーネントの新機能、各エディションの違いやパフォーマンス、お客様の声などをご紹介しています。
説明 PDF
リリースノート
製品の概要 (機能、製品内容を含む)、動作環境、既知の制限事項を説明します。
説明
ゲッティング・スタート・ガイド (英語)
製品を使い始める際の必要事項や、各種ドキュメントへのリンクなどが紹介されている Intel 社の Web ページです。
説明 WEB
ディベロッパー・ガイド/リファレンス・ガイド
インテル® TBB の各構文と意味に関する詳細な情報が参照できるように構成されています。
説明
チュートリアル: インテル® TBB を使用したアプリケーションの作成
インテル® TBB は、スレッドを使用する C++ コード向けのランタイムベースの並列プログラミング・モデルです。マルチコア・プロセッサーの潜在的なパフォーマンスの活用を支援する、テンプレート・ベースのランタイム・ライブラリーから構成されています。インテル) TBB を使用して、次の特徴を備えたスケーラブルなアプリケーションを作成できます。
  • スレッドの代わりに、論理並列構造を指定します。
  • データ並列プログラミングを重視します。
  • コンカレント・コレクションと並列アルゴリズムを利用します。
説明
Intel 社 Webinar「インテル® TBB を使用して C++ で並列処理を実装する」資料
インテル® TBB の利点、コンポーネント (インターフェース)、高水準の実行インターフェイスでの並列処理のマップ、マンデルブロの例、並列アルゴリズムなどを説明した Webinar の資料を日本語化しました。
説明 PDF
Intel 社 Webinar「最小限の労力で最大限のパフォーマンスを得る:インテル® パフォーマンス・ライブラリー」資料
インテル® Parallel Studio XE に含まれるパフォーマンス・ライブラリーについて、各ライブラリーごとの概要やバージョン 2018 の新機能、パフォーマンス・ベンチマークなどが紹介された Webinar の資料を日本語化しました。
  • インテルは最新のインテル® プロセッサー向けにチューニングされたパフォーマンス・ライブラリーのコレクションを提供
  • インテル® MKL
  • インテル® IPP
  • インテル® TBB
  • インテル® DAAL
  • インテル® Distribution for Python*
説明 PDF

参考資料

iSUS 関連記事
WEB
米インテル社製品ドキュメントページ (英語)
WEB
導入事例
WEB
開発のヒント
WEB
並列化技術マガジン
WEB
  • 本ページに掲載されていないドキュメントについては、Intel 社 Web 検索機能 (英語) をお試しください。お探しの資料が見つからない場合は、こちらからお問合せください。

バージョン 2019

製品カタログ (インテル® Parallel Studio XE およびそのコンポーネント)
PDF
製品紹介資料
インテル® Parallel Studio XE 2019 や同梱されるコンポーネントの新機能、各エディションの違いやパフォーマンス、お客様の声などをご紹介しています。
PDF
リリースノート
製品の新機能と注意事項の概要についての情報が含まれています。
説明
ゲッティング・スタート・ガイド (英語)
製品を使い始める際の必要事項や、各種ドキュメントへのリンクなどが紹介されている Intel 社の Web ページです。
説明

バージョン 2018

製品カタログ (インテル® Parallel Studio XE およびそのコンポーネント)
PDF
製品紹介資料 (インテル® Parallel Studio XE およびそのコンポーネント)
インテル® Parallel Studio XE 2018 や同梱されるコンポーネントの新機能、各エディションの違いやパフォーマンス、お客様の声などをご紹介しています。
説明 PDF
リリースノート
製品の新機能と注意事項の概要についての情報が含まれています。
説明
ゲッティング・スタート・ガイド (英語)
製品を使い始める際の必要事項や、各種ドキュメントへのリンクなどが紹介されている Intel 社の Web ページです。
説明
ディベロッパー・ガイド
インテル® DAAL 2018 の新機能、製品概要、アルゴリズム、インテル® DAAL のプログラミングの基本事項を説明します。
説明
Intel 社 Webinar「最小限の労力で最大限のパフォーマンスを得る:インテル® パフォーマンス・ライブラリー」資料
インテル® Parallel Studio XE に含まれるパフォーマンス・ライブラリーについて、各ライブラリーごとの概要やバージョン 2018 の新機能、パフォーマンス・ベンチマークなどが紹介された Webinar の資料を日本語化しました。
  • インテルは最新のインテル® プロセッサー向けにチューニングされたパフォーマンス・ライブラリーのコレクションを提供
  • インテル® MKL
  • インテル® IPP
  • インテル® TBB
  • インテル® DAAL
  • インテル® Distribution for Python*
説明 PDF

参考資料

iSUS 関連記事
WEB
米インテル社製品ドキュメントページ (英語)
WEB
開発のヒント
WEB
並列化技術マガジン
WEB

バージョン 2019

製品カタログ
PDF
製品カタログ (インテル® Parallel Studio XE およびそのコンポーネント)
PDF
製品紹介資料
インテル® Parallel Studio XE 2019 や同梱されるコンポーネントの新機能、各エディションの違いやパフォーマンス、お客様の声などをご紹介しています。
PDF
リリースノート
製品の概要 (機能、製品内容を含む)、動作環境、既知の制限事項を説明します。
説明
インストレーション・ガイド (英語)
各ホスト OS へ、製品をインストールする方法を説明しています。
説明
ユーザー・リファレンス・ガイド (英語)
製品の新機能、GUI の説明、レポートの見方などをご紹介しています。
説明

バージョン 2018

製品カタログ
PDF
製品カタログ (インテル® Parallel Studio XE およびそのコンポーネント)
PDF
製品紹介資料 (インテル® Parallel Studio XE およびそのコンポーネント)
インテル® Parallel Studio XE 2018 や同梱されるコンポーネントの新機能、各エディションの違いやパフォーマンス、お客様の声などをご紹介しています。
説明 PDF
インテル® VTune™ Amplifier Windows 環境向けスタートガイド おすすめ
このドキュメントでは、インテル® VTune™ Amplifier の概要と、製品に含まれるサンプルプログラムを使用して、以下の基本的な使用方法を説明します。短時間で基本の解析方法を理解することを目的とした入門ガイドです。
  • インテル® VTune™ Amplifier の起動方法
  • プロジェクトの作成、設定方法
  • 解析結果の表示と、解析画面の見方
  • ソースコードに掘り下げて解析結果を確認する方法
説明 PDF
インテル® VTune™ Amplifier パフォーマンス解析クックブック
インテル® VTune™ Amplifier は、開発者がコードを解析し、非効率なアルゴリズムおよびハードウェアの利用状況 を特定して、適切なパフォーマンス・チューニングのアドバイスを得られるように支援する、パフォーマンス・プロファ イル・ツールです。

このクックブックには、インテル ® VTune™ Amplifier で提供されるさまざまな解析タイプを使用して最も一般的なパフォーマンス問題を特定および解決するためのレシピが含まれています。
説明 PDF
リリースノート
製品の概要 (機能、製品内容を含む)、動作環境、既知の制限事項を説明します。
説明
インストレーション・ガイド (英語)
各ホスト OS へ、製品をインストールする方法を説明しています。
説明
ユーザー・リファレンス・ガイド (英語)
製品の新機能、GUI の説明、レポートの見方などをご紹介しています。
説明
インテル® VTune™ Amplifier 2018 オンラインヘルプ (iSUS 翻訳版: 主要トピックが日本語化されています)
WEB
Intel 社 Webinar「メモリー・アクセス・プロファイル: 一般的なパフォーマンス・ボトルネックの特定と修正」資料
インテル® VTune™ Amplifier は、高度で正確かつ、オーバーヘッドが非常に少ないプロファイリング機能を提供するだけでなく、データをマイニングして解釈するためのツールも提供します。

本コース資料では、インテル ® VTune™ Amplifier のメモリーアクセス解析を実行し、非効率なアレイアクセスパターンや NUMA の利用率低下など、一般的なパフォーマンス上の問題のさまざまな例を示します。
説明 PDF
Unreal Engine* 4.19 の最適化にインテルのソフトウェア・エンジニアが協力
Epic* の Unreal Engine* 4.19 のリリースは、インテル® テクノロジー向けの最適化、特にマルチコア・プロセッサーの最適化の歴史に新しいページを刻みました。これまで、ゲームエンジンは、グラフィックス機能およびパフォーマンスの点から、伝統的にコンソールの設計よりも後回しにされていました。一般に、ほとんどのゲームは最新のプロセッサー向けに最適化されず、PC のパフォーマンスの多くはアイドル状態のまま活用されていませんでした。インテルは、開発者が Unreal Engine* 4 でワークを実行する際に、PC プラットフォームが提供するプロセッサーの計算能力をすべて利用し、ただちにゲームの性能を引き出せるように取り組みました。

Unreal Engine* バージョン 4.19 では、インテル® VTune™ Amplifier の統合をサポートします。
説明 PDF

参考資料

iSUS 関連記事
WEB
米インテル社製品ドキュメントページ (英語)
WEB
導入事例
WEB
開発のヒント
WEB
並列化技術マガジン
WEB

バージョン 2019

製品カタログ (インテル® Parallel Studio XE およびそのコンポーネント)
PDF
製品紹介資料
インテル® Parallel Studio XE 2019 や同梱されるコンポーネントの新機能、各エディションの違いやパフォーマンス、お客様の声などをご紹介しています。
PDF
インストールガイド兼リリースノート
製品の概要 (機能、製品内容を含む)、動作環境、既知の制限事項を説明します。
説明

バージョン 2018

製品カタログ (インテル® Parallel Studio XE およびそのコンポーネント)
PDF
製品紹介資料 (インテル® Parallel Studio XE およびそのコンポーネント)
インテル® Parallel Studio XE 2018 や同梱されるコンポーネントの新機能、各エディションの違いやパフォーマンス、お客様の声などをご紹介しています。
説明 PDF
インストールガイド兼リリースノート
製品の概要 (機能、製品内容を含む)、動作環境、既知の制限事項を説明します。
説明
インテル® Advisor 2018 ベクトル化アドバイザー入門ガイド

インテル® Advisor 製品は、並列プログラミングを行う上で重要なベクトル化とスレッド化を支援するためのアドバイザー・ツールです。インテル® Advisor のベクトル化アドバイザーは、アプリケーションに実装されているループ処理、および関数を調査し、必要な情報を提供します。

本ガイドはインテル® Advisor のベクトル化アドバイザーに付属する C++ 言語のサンプルプログラムを使用して、ベクトル化アドバイザーから必要な情報を取得するための使用方法と、各画面の見方をチュートリアル形式で説明します。本チュートリアルでは以下のステップを実行します。

  1. 必要条件の設定
  2. インテル® Advisor の起動
  3. プロジェクトの作成と設定
  4. ベクトル化に関する情報を取得する
  5. ループ情報の詳細を取得する
  6. メモリー・アクセス・パターンを取得する
  7. データ間の依存性を解析する

説明 PDF
ユーザー・リファレンス・ガイド (英語)
製品の新機能、GUI の説明、レポートの見方などをご紹介しています。
説明
Intel 社記事「インテル® Advisor のルーフライン」
この記事は、2017年 12月 18日時点の、インテル® デベロッパー・ゾーンに公開されている「Intel® Advisor Roofline」の日本語訳です。

ルーフライン・モデルとは?ルーフライン・グラフは、メモリー帯域幅や計算のピークを含む、ハードウェアの制限に関連するアプリケーション・パフォーマンスのビジュアルな表現です。詳しくは本記事でご紹介しています。
説明 PDF
Intel 社記事「コールスタックを利用したルーフライン」
この記事は、2017年 12月 18日時点の、インテル® デベロッパー・ゾーンに公開されている「Roofline with Callstacks」の日本語訳です。

コールスタックを利用したルーフラインは、インテル ® Advisor のキャッシュを考慮したルーフラインの拡張機能です。この機能は、2018 Update 1 で正式にサポートされました。2018 初期リリースでは、階層ルーフラインという名前のプレビュー機能でしたが、似た名前の異なる機能との混同を避けるため、現在の名前に変更されました。
説明 PDF

参考資料

iSUS 関連記事
WEB
米インテル社製品ドキュメントページ (英語)
WEB
導入事例
WEB
開発のヒント
WEB
並列化技術マガジン
WEB

バージョン 2019

製品カタログ (インテル® Parallel Studio XE およびそのコンポーネント)
PDF
製品紹介資料
インテル® Parallel Studio XE 2019 や同梱されるコンポーネントの新機能、各エディションの違いやパフォーマンス、お客様の声などをご紹介しています。
PDF
リリースノート
製品の概要 (機能、製品内容を含む)、動作環境、既知の制限事項を説明します。
説明
ユーザー・リファレンス・ガイド (英語)
製品の新機能、GUI の説明、レポートの見方などをご紹介しています。
説明

バージョン 2018

製品カタログ (インテル® Parallel Studio XE およびそのコンポーネント)
PDF
製品紹介資料 (インテル® Parallel Studio XE およびそのコンポーネント)
インテル® Parallel Studio XE 2018 や同梱されるコンポーネントの新機能、各エディションの違いやパフォーマンス、お客様の声などをご紹介しています。
説明 PDF
リリースノート
製品の概要 (機能、製品内容を含む)、動作環境、既知の制限事項を説明します。
説明
ユーザー・リファレンス・ガイド (英語)
製品の新機能、GUI の説明、レポートの見方などをご紹介しています。
説明

参考資料

iSUS 関連記事
WEB
米インテル社製品ドキュメントページ (英語)
WEB
導入事例
WEB
開発のヒント
WEB
並列化技術マガジン
WEB

バージョン 2019

製品カタログ (インテル® Parallel Studio XE およびそのコンポーネント)
PDF
製品紹介資料
インテル® Parallel Studio XE 2019 や同梱されるコンポーネントの新機能、各エディションの違いやパフォーマンス、お客様の声などをご紹介しています。
PDF
リリースノート
製品の概要 (機能、製品内容を含む)、動作環境、既知の制限事項を説明します。
説明
ディベロッパー・ガイド (英語)
製品のインストールやコンパイラーとのリンク方法、実行方法や主な機能をご紹介しています。
説明
ディベロッパー・リファレンス・ガイド (英語)
製品のコマンド、オプション、コントロール、命令などをご紹介しています。
説明
ゲッティング・スタート・ガイド (英語)
製品を使い始めるにあたり役立つ、基本的な情報をご紹介しています。
説明

バージョン 2018

製品カタログ (インテル® Parallel Studio XE およびそのコンポーネント)
PDF
製品紹介資料 (インテル® Parallel Studio XE およびそのコンポーネント)
インテル® Parallel Studio XE 2018 や同梱されるコンポーネントの新機能、各エディションの違いやパフォーマンス、お客様の声などをご紹介しています。
説明 PDF
リリースノート
製品の概要 (機能、製品内容を含む)、動作環境、既知の制限事項を説明します。
説明
チュートリアル: MPI/OpenMP* ハイブリッド・アプリケーションの解析
インテル® Parallel Studio XE を使用して非効率な MPI コードを確認し、スレッドのロードバランスを取ることによりハイブリッド・アプリケーションをチューニングする方法を説明します。
説明 PDF
ディベロッパー・ガイド (英語)
製品のインストールやコンパイラーとのリンク方法、実行方法や主な機能をご紹介しています。
説明
ディベロッパー・リファレンス・ガイド (英語)
製品のコマンド、オプション、コントロール、命令などをご紹介しています。
説明
ゲッティング・スタート・ガイド (英語)
製品を使い始めるにあたり役立つ、基本的な情報をご紹介しています。
説明
Intel 社 Webinar「さらに効率良く高速でスケーラブル: エクサスケールに向けて前進」資料
クラスターは日々進化し、MPI* (Message Passing Interface*)アプリケーションの開発、チューニング、スケーリングが不可欠になりました。より多くのコアとより多くのスレッドを持つノードをより多く提供します。すべてが高速ファブリックによって相互接続されています。
エクサスケール・コンピューティング・プロジェクトによれば、超高性能スーパーコンピュータは、精密で計算量の多い用途(医学、製造、気候など)に関わるプロセスを現実的にシミュレートため、1秒ごとに数百万回の計算を処理します。
エクサスケール・レースの一環として、Argonne National Labs の MPICH* ソースベース(これは高性能で広く移植可能な MPI の実装であり、インテル® MPI ライブラリーの基礎でもあります)が更新されました。

本コース資料では、以下のトピックについてご紹介しています。
  • 分散プログラミング向けインテル® ソフトウェア・ツール
  • インテル® MPI ライブラリー
  • インテル® MPI ライブラリー 2018 Update 1 の新機能
  • インテル® MPI ライブラリー 2019 テクニカルプレビュー機能
説明 PDF

参考資料

iSUS 関連記事
WEB
米インテル社製品ドキュメントページ (英語)
WEB
導入事例
WEB
開発のヒント
WEB
並列化技術マガジン
WEB

バージョン 2019

製品カタログ (インテル® Parallel Studio XE およびそのコンポーネント)
PDF
製品紹介資料
インテル® Parallel Studio XE 2019 や同梱されるコンポーネントの新機能、各エディションの違いやパフォーマンス、お客様の声などをご紹介しています。
PDF
リリースノート
製品の概要、動作環境、既知の制限事項を説明します。
説明
GUI 説明&入門ガイド (英語)
インテル® Trace Analyzer & Collector 2019 の主要機能、グラフィカル・ユーザー・インターフェース (GUI) の各要素の説明、各ホスト OS (Windows®/Linux*/macOS*) で製品を使い始めるにあたって必要な基本ステップをご紹介しています。
説明 WEB
ユーザー・リファレンス・ガイド (英語)
製品の新機能、GUI の説明、レポートの見方などをご紹介しています。
説明

バージョン 2018

製品カタログ (インテル® Parallel Studio XE およびそのコンポーネント)
PDF
製品紹介資料 (インテル® Parallel Studio XE およびそのコンポーネント)
インテル® Parallel Studio XE 2018 や同梱されるコンポーネントの新機能、各エディションの違いやパフォーマンス、お客様の声などをご紹介しています。
説明 PDF
リリースノート
製品の概要、動作環境、既知の制限事項を説明します。
説明
GUI 説明&入門ガイド (英語)
インテル® Trace Analyzer & Collector 2018 の主要機能、グラフィカル・ユーザー・インターフェース (GUI) の各要素の説明、各ホスト OS (Windows®/Linux*/macOS*) で製品を使い始めるにあたって必要な基本ステップをご紹介しています。
説明 WEB
ユーザー・リファレンス・ガイド (英語)
製品の新機能、GUI の説明、レポートの見方などをご紹介しています。
説明

参考資料

iSUS 関連記事
WEB
米インテル社製品ドキュメントページ (英語)
WEB
導入事例
WEB
開発のヒント
WEB
並列化技術マガジン
WEB
  • 本ページに掲載されていないドキュメントについては、Intel 社 Web 検索機能 (英語) をお試しください。お探しの資料が見つからない場合は、こちらからお問合せください。

バージョン 2019

製品カタログ (インテル® Parallel Studio XE およびそのコンポーネント)
PDF
製品紹介資料
インテル® Parallel Studio XE 2019 や同梱されるコンポーネントの新機能、各エディションの違いやパフォーマンス、お客様の声などをご紹介しています。
PDF
リリースノート
製品の概要 (機能、製品内容を含む)、動作環境、既知の制限事項を説明します。

PDF :
初期リリース (英語)
説明
インテル® Distribution for Python* 向けインテル® 最適化済みパッケージ・リスト (英語)
インテル® Distribution for Python* に含まれるインテル® 最適化済みパッケージの情報です。
説明 / WEB
インテル® Distribution for Python* 向け全パッケージ・リスト (英語)
インテル® Distribution for Python* に含まれる全パッケージの情報です。
説明 / WEB

バージョン 2018

製品カタログ (インテル® Parallel Studio XE およびそのコンポーネント)
PDF
製品紹介資料 (インテル® Parallel Studio XE およびそのコンポーネント)
インテル® Parallel Studio XE 2018 や同梱されるコンポーネントの新機能、各エディションの違いやパフォーマンス、お客様の声などをご紹介しています。
説明 PDF
リリースノート
製品の概要 (機能、製品内容を含む)、動作環境、既知の制限事項を説明します。

PDF :
初期リリース / Update1 (英語) / Update2 (英語) / Update3 (英語)
説明
インテル® Distribution for Python* 向けインテル® 最適化済みパッケージ・リスト (英語)
インテル® Distribution for Python* に含まれるインテル® 最適化済みパッケージの情報です。
説明 / WEB
インテル® Distribution for Python* 向け全パッケージ・リスト (英語)
インテル® Distribution for Python* に含まれる全パッケージの情報です。
説明 / WEB
Intel 社 Webinar「Python* はネイティブコードと同じくらい速いのか?」資料
Python* の最大のメリットの 1つは、学習と使用が簡単だということです。しかし、高性能な計算集約型アプリケーションで遅いという点も有名です。 インテル ® Distribution for Python* は、この基本的なパフォーマンス上の課題に対処し、幅広いインテル® プロセッサー向けの最適化と、コンパイルされたプログラム言語の速度を実現します。

本コース資料では、以下のトピックについてご紹介しています。
  • 両言語のベストを得る方法: Python* の生産性と C 言語のようなパフォーマンス
  • Python* コードを高速化する3 ステップのアプローチ
  • 関連ライブラリー
説明 PDF
Intel 社 Webinar「最小限の労力で最大限のパフォーマンスを得る:インテル® パフォーマンス・ライブラリー」資料
インテル® Parallel Studio XE に含まれるパフォーマンス・ライブラリーについて、各ライブラリーごとの概要やバージョン 2018 の新機能、パフォーマンス・ベンチマークなどが紹介された Webinar の資料を日本語化しました。
  • インテルは最新のインテル® プロセッサー向けにチューニングされたパフォーマンス・ライブラリーのコレクションを提供
  • インテル® MKL
  • インテル® IPP
  • インテル® TBB
  • インテル® DAAL
  • インテル® Distribution for Python*
説明 PDF

参考資料

iSUS 関連記事
WEB
米インテル社製品ドキュメントページ (英語)
WEB
開発のヒント
WEB
並列化技術マガジン
WEB

バージョン 2018

製品カタログ
PDF
製品紹介資料
インテル® Media Server Studio 2018 の新機能、各エディションの違いやコンポーネント、パフォーマンス・ベンチマーク、お客様の声などをご紹介しています。
説明 PDF
リリースノート (英語)
製品の概要 (機能、製品内容を含む)、動作環境、既知の制限事項を説明します。
説明
インテル® Media Server Studio を使用して高品質、高性能 HEVC を提供 (英語)
HEVC は、次世代のデジタル・メディア・アプリケーション、製品、サービスを可能にするエキサイティングで最先端かつ高効率なビデオ圧縮技術です。インテルはこの開発の最前線にあり、HEVC 技術の革命をリードしています。インテル ® Media Server Studio 2018 は、品質とパフォーマンスの優れたトレードオフを提供し、HEVC ソリューションの中で業界をリードしています。
このホワイトペーパーでは、インテルの開発者向け HEVC 製品、インテル® Media Server Studio の HEVC エンコーダおよびデコーダの最新機能を紹介します。
説明 PDF

バージョン 2017

製品カタログ
PDF
製品紹介資料
インテル® Media Server Studio 2017、インテル® Video Pro Analyzer 2017、インテル ® Stress Bitstreams and Encoder 2017 の新機能、各エディションの違いやコンポーネント、パフォーマンス・ベンチマーク、お客様の声などをご紹介しています。
説明 PDF
リリースノート (英語)
製品の概要 (機能、製品内容を含む)、動作環境、既知の制限事項を説明します。
説明
Intel 社 Webinar「最新のインテル® プロセッサー向けメディア・ソリューション/アプリケーションの開発」資料

Happy Together:インテル プロセッサー+ソフトウェアによる画期的なメディアパフォーマンス。
最新のインテル社のハードウェアとメディア・ソフトウェアが連携して、メディア・ワークロードやビデオ・ストリーミングの高速かつ高品質な結果を得ることができます。
これらのプラットフォームを活用し、インテル ® Xeon® プロセッサー E3-1500v5 および第 6 世代インテル® Core™ プロセッサー(開発コードネーム:Skylake)のハードウェア・アクセラレーション・コーデックへのアクセス方法を学びます。
主なトピックは、下記の通りです。

  • インテル® Media Server Studio またはインテル® Media SDK を使用して、HEVC、AVC および MPEG-2 のメディア・ソリューションおよびアプリケーションを最適化
  • 1台のプラットフォームでリアルタイム 4K@60fps HEVC、最大 18 AVC HD@30fps トランスコード・セッションを達成
  • インテル® グラフィックス・プロセッサー(GPU)で最大の性能向上を実現
  • ショートカットのためのスキニーを取得し、結果を速く確認
説明 PDF
「インテル® 統合グラフィックス向けのソフトウェア開発環境のご紹介」セミナー セッション資料

2017年 4月 21日に開催された本セミナーでは、インテル® 統合グラフィックスに実装されているハードウェア機能とそれらをアプリケーションから実装するための Linux* 向けインテル® ソフトウエア開発製品を紹介しました。本セミナーの各セッションごとの PDF 資料を公開しております。
セミナー詳細は こちらのセミナーページをご覧ください。

説明

参考資料

iSUS 関連記事
WEB
米インテル社製品ドキュメントページ (英語)
WEB
導入事例
WEB
お客様の声
WEB
開発のヒント
WEB
並列化技術マガジン
WEB

バージョン 2018

製品カタログ
PDF
製品紹介資料
PDF
リリースノート
製品の概要 (機能、製品内容を含む)、動作環境、既知の制限事項を説明します。
説明
入門ガイド
製品を使い始めるにあたり役立つ情報を集めたガイドです。 この入門ガイドは以下の 3 つのセクションから構成されています。
  • アプリケーション開発
  • プロファイルおよび解析
  • ハードウェア・システム/プラットフォームの起動
説明
各種コンポーネントのリリースノート (英語)
コンパイラーやライブラリー、ツールのリリースノートは、米インテル社のサイトから入手できます。
説明
新機能紹介 (英語)
初期リリースおよびアップデート・バージョンで追加された新機能や新たにサポート対象となった開発環境、OS などをご紹介しています。
説明 WEB
Intel 社記事「Parallel STL 入門ガイド」
この記事は、2018 年 6 月 12 日時点の、インテル® デベロッパー・ゾーンに公開されている「Getting Started with Parallel STL」の日本語訳です。
Parallel STL は、一般に C++17 と呼ばれる C++ 標準の次期バージョンの Working Draft N4659 で指定されている、実行ポリシーをサポートする C++ 標準ライブラリー・アルゴリズム の実装です。この実装は、ISO C++ Working Group Paper P0076R3 で指定されている、順序 関係が存在しない実行ポリシーもサポートしています。
Parallel STL は、インテル® プロセッサー向けアルゴリズムの並列実行とベクトル実行の両方を効率的にサポートします。シーケンシャル実行は、C++ 標準ライブラリーの利用可能な実装に依存します。インテル® Parallel Studio XE およびインテル® System Studio の一部として利用できます。本資料では、以下のトピックについてステップに沿って解説しています。
  1. 使用のための準備
  2. Parallel STL の使用
  3. サンプル
  4. 実装されているアルゴリズム
説明 PDF

バージョン 2017

製品カタログ
PDF
製品紹介資料
PDF
インテル® コンパイラー 17.0 新機能&ベンチマーク紹介資料
PDF
インストールガイド兼リリースノート (英語)
製品の概要 (機能、製品内容を含む)、動作環境、既知の制限事項を説明します。
説明
各種コンポーネントのリリースノート (英語)
コンパイラーやライブラリー、ツールのリリースノートは、米インテル社のサイトから入手できます。
説明
新機能紹介 (英語)
初期リリースおよびアップデート・バージョンで追加された新機能や新たにサポート対象となった開発環境、OS などをご紹介しています。
説明
マシンラーニングにもスムーズに対応 - インテル® ソフトウェア・ツールで生産性とパフォーマンスを向上 資料
インテル® ソフトウェア開発ツールを使うことで、世の中に幅広く普及するマシンラーニング・テクノロジーの複雑な機能や処理を、簡単に効率良く開発できるようになります。

本資料では、ソフトウェア開発ツール インテル® Parallel Studio XE およびインテル® System Studio に含まれるマシンラーニング対応のツールやライブラリーの機能紹介に加え、マシンラーニング向けのソフトウェア開発に関するさまざまな情報を紹介しています。 これらのツールは、パフォーマンス向上と開発期間の短縮を実現し、マシンラーニングのすべてのワークフローをカバーします。
説明 PDF

参考資料

iSUS 関連記事
WEB
米インテル社製品ドキュメントページ (英語)
WEB
導入事例
WEB
お客様の声
WEB
開発のヒント
WEB
並列化技術マガジン
WEB
製品カタログ
PDF
ソリューション・ガイド
製品概要、使用例などを説明します。
説明 PDF
製品カタログ (データシート)
PDF
製品カタログ (データシート)
PDF

Parallel Universe 33号

【注目記事】

  • BigDL により Apache Spark* 上で 人工知能を向上

【掲載記事】

  • WebAssembly が Web 上のコンピューティングの未来を握る理由
  • コードの現代化を実践 : スレッド化、 メモリー、 ベクトル化の最適化
  • Java* による不揮発性メモリー ・ コンピューティング
  • より高速な勾配ブースティング決定木
  • MPI-3 の非ブロッキング集合操作による通信レイテンシーの隠蔽
- 編集者からのメッセージ -

BigDL が注目を集めている理由

私が大規模データ解析に Apache Spark* を使い始めた頃、MLlib はこのフレームワークでマシンラーニングを行うための唯一の選択肢でした。MLlib は優れたパッケージですが、制限もあります。BigDL は Apache Spark* にディープラーニングをもたらしました。2016 年 12 月に BigDL が最初にリリースされたとき、私は開発者にその概要を尋ねました : 「BigDL: Apache Spark* 上の最適化されたディープラーニング」(The Parallel Universe 28 号)。この号の注目記事 「BigDL により Apache Spark* 上で人工知能を向上」 では、それから 1 年半経った BigDL の新機能をチェックします。

お気に入りのプログラミング言語でアプリケーションを開発し、Web に配備して、ネイティブに近いパフォーマンスを達成できることを想像してみてください。前号では、Web ブラウザー内で高度なコンピューター ・ ビジョン計算を行う新しいテクノロジーである OpenCV.js を紹介しました : 「コンピューター ・ ビジョンの普及」 (The Parallel Universe 32 号)。この号の記事 「WebAssembly が Web 上のコンピューティングの未来を握る理由」 では、ブラウザー内で複雑な計算を実行する新しいテクノロジーを紹介します。

私は、アプリケーションのパフォーマンス ・ データを収集して、簡潔に表示するプログラミング ・ ツールを評価したことがあります。最初は、その豊富なデータとカラフルな GUI に魅了されました。しかし、目新しさがなくなると、どのデータも実用的ではなく、アプリケーションのチューニングにそれほど有用ではないことに気付きました。
「コードの現代化を実践」 では、インテル® Parallel Studio XE の解析ツールを利用してコードの現代化を行う方法を示します。

不揮発性メモリーは、ますます重要なハードウェア ・ テクノロジーになっています。「Java* による不揮発性メモリー ・ コンピューティング」 では、Java* アプリケーションでこのテクノロジーを利用できるようにするライブラリーを紹介します。不揮発性メモリーについては、今後の The Parallel Universe でも取り上げていく予定です。

「より高速な勾配ブースティング決定木」 では、インテル® DAAL の最新バージョンの新機能と拡張を紹介します。

インテル® MPI ライブラリーも、新しいハードウェアと MPI 規格の変更に対応するため継続的に開発が進められています。私の知る限り、MPI のレイテンシーを隠蔽するため常に通信と計算をオーバーラップすることは、一般的な手法とされてきました。しかし、実際のアプリケーションで通信と計算のオーバーラップによるパフォーマンスの利点を示すことは困難です。そのため、数年前に MPI 規格に非ブロッキング集合操作が追加されたとき、私はそれほど注目していませんでした。「MPI-3 の非ブロッキング集合操作による通信レイテンシーの隠蔽」 は、これ
らの新しい関数について、特に大規模なデータセットを処理する多数の計算ノードを利用する必要がある場合に再考するきっかけとなりました。

Henry A. Gabb インテル コーポレーション シニア主席エンジニア
2018 年 7 月

Parallel Universe 32号

【注目記事】

  • コンピューター・ビジョンの普及

【掲載記事】

  • ゲームをスピードアップ
  • ハイパフォーマンス・ビッグデータ・コンピューティング向け Harp-DAAL
  • 命令パイプラインに関する考察
  • インテル® Xeon® スケーラブル・プロセッサー上の並列 CFD と HiFUN ソルバー
  • VASP 材料シミュレーション・パフォーマンスの向上
- 編集者からのメッセージ -

コンピューター・ビジョン: 間もなくブラウザーで利用可能に

私はコンピューター・ビジョンについて、Dr. Dobb's Journal に掲載されている Gary Bradski の OpenCV* の記事 (英語) で初めて知りました。Gary は当時インテル ラボに在籍していました。私はその数 か月前にインテルに入社したばかりで、インテルがコンピューター・ビジョン分野で取り組みを行っていることに 驚きました。OpenCV* は 17 年前に最初にリリースされて以来、長い道のりを歩んできました。その名のとおり、 オープンソースとして、非営利団体の OpenCV.org (英語) によって支援されてきました。この号の注目記事「コ ンピューター・ビジョンの普及」では、カリフォルニア大学アーバイン校とインテル ラボの共同研究者グループ による、 Open Web Platform* (英語) 内でハイパフォーマンスなコンピューター・ビジョンを実現する取り組 みとして、OpenCV* の主要機能の JavaScript* への変換と、エッジ検出、顔認識、背景除去や、ディープ・ニューラル・ネットワークを用いた画像認識などの一般的なコンピューター・ビジョン・アプリケーションをブラウザー 内で実行する魅力的な例を紹介します。

グラフィックスおよびビデオ処理に関する記事、「ゲームをスピードアップ」では、インテル® Graphics Performance Analyzers (英語) を利用してゲーム・パフォーマンスを最適化する方法を示します。これらの 開発ツールが、アーティスト、デザイナー、ゲームプレイ・プログラマー、ゲーム・エンジン・プログラマーなど、ゲー ム開発チームの異なるメンバーにもたらす利点をユースケースを用いて紹介します。

Google* File System (英語) と MapReduce (英語) は、2003 年に大規模な分散メモリー型データ 解析時代を切り拓きました。それ以来、大規模なデータ解析とマシンラーニングの多くの選択肢が利用 可能になりました。 Apache Spark* ( 英語) が私の現在のお気に入りですが、これまでに Dask (英語)、 HPAT (インテル ラボの High-Performance Analytics Toolkit プロジェクト)、その他いくつかの選択 肢を試したことがあります。「ハイパフォーマンス・ビッグデータ・コンピューティング向け Harp-DAAL」 でインディアナ大学の Judy Qiu 教授は、高度に最適化されたインテル® データ・アナリティクス・アクセ ラレーション・ライブラリー (インテル® DAAL) を利用する新しいフレームワークを紹介し、Harp-DAAL を使用して K 平均法を実装する Java* コードの例を示しています。

ハイレベルの抽象化とは正反対の「命令パイプラインに関する考察」は、命令パイプラインの概念的な概要と、 現代のプロセッサーのパフォーマンスにおけるその重要性を説明します。この号の最後を締めくくるのは、計算 負荷の高い科学アプリケーションのパフォーマンスの向上に関する 2 つの記事「インテル® Xeon® スケーラブ ル・プロセッサー上の並列 CFD と HiFUN ソルバー」と「VASP 材料シミュレーション・パフォーマンスの向 上」です。前者は、実際の流体力学アプリケーションを使用して並列パフォーマンスのチューニングを行うケー ススタディーです。後者は、 インテル® VTune™ Amplifier のアプリケーション・パフォーマンス・スナップショッ トを使用してアプリケーション・パフォーマンスの要約を取得する方法と、 インテル® MPI ライブラリーの新し いプレビュー機能を紹介します。

今後の The Parallel Universe では、Apache Spark* 解析フレームワーク内でのディープラーニングの実行、 Java* パフォーマンスの拡張、I/O パフォーマンスのプロファイルとチューニング、インテル® ソフトウェア開発ツー ルの新機能などを含む、さまざまなトピックについて取り上げる予定です。お見逃しなく。

Henry A. Gabb インテル コーポレーション シニア主席エンジニア
2018 年 4 月

Parallel Universe 31号

【注目記事】

  • OpenCL* による FPGA プログラミング
  • 自動運転ワークロードに適した Eigen 数学ライブラリーの構築
  • インテル® MKL のベクトル化された圧縮行列関数による代数計算の高速化

【掲載記事】

  • ビッグデータ・アプリケーションで Java* のパフォーマンスを向上する
  • インテル® Advisor の Python* APIによりパフォーマンスの詳細を得る
  • インテル® AI Academy へようこそ
- 編集者からのメッセージ -

2018 年の並列計算

2018 年最初の The Parallel Universe へようこそ。年初にあたり、今後のハードウェアとソフトウェアの傾向についていくつかの予測を行うことを考えましたが、私はコンピューティングの先見者というよりもむしろファストフォロワーです。結局のところ、私の専門はバイオテクノロジーとデータサイエンスであり、コンピューター・サイエンスではありません。前号で、私はヘテロジニアス並列コンピューティングの将来に関して、それほど大胆ではない予測を行いました。私は 2009 年からヘテロジニアス並列処理に関して気にかけていましたが、真の先見者はその何年も前から考えていました。皆さんの周りのあらゆるところで新しい傾向が見られるとしたら、それはもはや予測 ではありませんが、FPGA は、ヘテロジニアスへと向かう進化の次のフェーズに達したと言って良いでしょう。

間もなく FPGA はマルチコア・プロセッサーのようにあたりまえになります。しかし、多くは FPGA を効率的にプログラムできていません。そこで、The Parallel Universe の創刊者兼編集者であった James Reinders に、FPGA プログラミングに関する記事の執筆を依頼しました。前号では、FPGA プログラミングについてソフトウェア開発の視点から述べました。この号では、James とインテルのプログラマブル・ロジック・グループの Tom Hill による、OpenCL* による FPGA プログラミングに取り組むための、詳細な解説を紹介します。OpenCL* (Open Computing Language) は、「ヘテロジニアス・システムにおける並列プログラミングのためのオープン規格」です。我々にとって、FPGA プログラミングで最初に取り組むのは OpenCL* です。

2018 年も引き続き、さまざまなプログラミング・ツールとプログラミング・モデルを紹介していきます。この号の 2 つの記事、「インテル® MKL のベクトル化された圧縮行列関数による代数計算の高速化」および「インテル® Advisor の Python* API によりパフォーマンスの詳細を得る」では、インテル® ソフトウェア開発ツールの新しい機能を取り上げています。1 つ目の記事は、小さな行列の大きなグループを計算するア プリケーションのパフォーマンスを向上するために設計された新しいデータ形式について説明します。2 つ目の記事は、アプリケーション・パフォーマンスのカスタム解析を行ったりカスタム視覚化を作成する、インテル® Advisor データベースに直接アクセスする新しい API について説明します。

Java* は世界で最もポピュラーなプログラミング言語の 1 つですが、The Parallel Universe ではこれまであまり取り上げていませんでした。2018 年は、この状況が変化することになるでしょう。インテル® Parallel Studio XE は Java* チューニング・サポートを改良しており、Java* JVM はベクトル計算のサポートを強化しています。「ビッグデータ・アプリケーションで Java* のパフォーマンスを向上する」では、後者の拡張を説明します。

人工知能 (AI) は 2018 年もホットな話題の 1 つです。自動運転は AI の進歩により現実のものとなりましたが、その処理にはハイパフォーマンス・コンピューティングが必須です。「自動運転ワークロードに適した Eigen 数学ライブラリーの構築」では、重要な計算カーネルのパフォーマンスを向上する方法を説明します。最後に、「インテル® AI Academy へようこそ」では、AI 教育、ツール、テクノロジー向けの、インテルの新しい包括的なプログラムの概要を紹介します。

Henry A. Gabb インテル コーポレーション 主席エンジニア
2018 年 1 月

Parallel Universe 30号

【注目記事】

  • インテル® Advisor のフローグラフ・アナライザーで自動運転コードのパフォーマンスを向上
  • コードの現代化によるパフォーマンス、移植性、スケーラビリティーの向上、インテル® Parallel Studio XE 2018 の新機能

【掲載記事】

  • OpenMP* が大人の仲間入り
  • ソフトウェア開発者による FPGA の利用
  • 外れ値への対応
  • 最新の SIMD 拡張とインテル® アドバンスト・ベクトル・エクステンション 512 (インテル® AVX-512) による成功のためのチューニング
  • クラスター全体の効率良い使用
  • あなたのクラスターは健全ですか?
  • HPC クラスターの最適化
- 編集者からのメッセージ -

インテル® Parallel Studio XE 2018 のリリース

インテル® Parallel Studio XE 2018 は、インテル® アーキテクチャー上でソフトウェアを現代化するインテルの包括的なツールスイートの最新バージョンです。このリリースを祝って、本号ではインテル® Parallel Studio XE のコンポーネントに関するいくつかの記事を取り上げています。「コードの現代化によるパフォーマンス、移植性、スケーラビリティーの向上」では、このツールスイートで提供される多数の新機能を紹介します。「外れ値への対応」では、インテル® データ・アナリティクス・アクセラレーション・ライブラリー (インテル® DAAL) を利用して、クレジットカード取引の実際のデータセットで不正を検出し、ハイパフォーマンスと高精度を達成する方法を紹介します。

ヘテロジニアス並列コンピューティングの将来

将来は、ヘテロジニアスです。(実際、何年も前から CPU と GPU は同じシステムだけでなく、同じプロセッサー・ダイ上に統合されています。つまり、ヘテロジニアス・コンピューティングの時代はすでに到来しているのです。) マルチコア・プロセッサーにより並列処理が当たり前のものになったように、間もなく CPU、GPU、FPGA、ASIC などが同じシステム内に共存し、ヘテロジニアス並列処理が一般的なものになるでしょう。私はかつてヘテロジニアスの将来に不安を覚えていましたが、新しい並列プログラミング・モデルは、計算処理を最も効率良いプロセッサー・アーキテクチャーへ簡単にマップできるようにします。

「インテル® Advisor のフローグラフ・アナライザーで自動運転コードのパフォーマンスを向上」では、インテル® Parallel Studio XE のプレビュー機能であるフローグラフ・アナライザー (FGA) について詳しく見ていきます。自動運転アプリケーションを例に、フローグラフ計算と解析について説明します。

また、本号では HPC 関連の 3 つの記事を掲載しています。「あなたのクラスターは健全ですか?」では、インテル® Cluster Checker について取り上げます。 インテル ® Parallel Studio XE のこのコンポーネントは、多くの最も一般的な手法とシステム診断により、クラスターが効率良く動作するように支援します。いくつかの BIOS オプションは、アプリケーションのパフォーマンスに影響しますが、実稼働中のクラスター環境でそれらのオプションをオンデマンドで変更することは困難です。「HPC クラスターの最適化」では、オンデマンドでクラスター設定を変更する手法を習得することができます。そして、「クラスター全体の効率良い使用」では、インテル® Parallel Studio XE のいくつかのツールを使用して、HPC アプリケーションをチューニングするケーススタディーを紹介します。

Henry A. Gabb インテル コーポレーション 主席エンジニア
2017 年 10 月

Parallel Universe 29号

【注目記事】

  • インテル® System Studio による自動運転のチューニング

【掲載記事】

  • OpenMP* 20 周年
  • Julia: スーパーコンピューティング向け高水準言語
  • ベクトル化が再び重要に
  • クラウドおよびエッジ・アプリケーション向けの高速データ圧縮コードのビルド
  • インテル® C++ コンパイラーによる MySQL* の最適化
  • インテル® DAAL による R の線形回帰の高速化
- 編集者からのメッセージ -

C90 と Julia

1993 年に、私が博士課程修了後の研究を行っていた研究所では、Cray* C90 スーパーコンピューターにアクセスしていました。このシステムの利用競争率は凄まじく、C90 のアーキテクチャーを活用していないプログラムは別のシステムで実行するように、とストレートに言われたものです。C90 はベクトル・プロセッサーであったため、我々はコードをベクトル化する必要がありました。コンパイラーのレポートを調べて必要なコード修正に時間をかけることで、パフォーマンスが大幅に向上したことを覚えています。ベクトル化は、マルチコア時代では並列化の最前線から一歩引いてしまいましたが、この最適化手法が重要であることに変わりはありません。「ベクトル化が再び重要に」では、Robert H. Dodds Jr. イリノイ大学名誉教授が、最新のプログラミング・ツールを利用して実際のアプリケーションをベクトル化する方法を説明します。

今号でも引き続き、OpenMP* 20 周年の特別記事として、Livermore Computing の CTO であり、OpenMP* 言語委員会の現在の委員長である Bronis R. de Supinski 氏から寄せられた論説を掲載します。Bronis 氏は、「OpenMP* 20 周年」の中で、OpenMP* の概念と発展、およびその将来についての見解を述べています。20 周年を迎えてもなお、OpenMP* は現代的なアーキテクチャーとともに発展を続けています。

私は Perl マニアになる前は Fortran マニアでしたが、今は Python* マニアです。最近、私は Julia と呼ばれる新しいプログラミング言語に触れる機会がありました。そこで、いくつか時間のかかるデータ処理アプリケーションを、できるだけ行単位での変換を心がけながら、Python* から Julia に書き直しました。これらは Julia の得意とする大量の数値計算を行うアプリケーションではなく、テキストマイニングのデータセットを準備するストリング操作アプリケーションでしたが、パフォーマンスの向上は衝撃的なものでした。私は Python* とその膨大なエコシステムを手放す気はまだありませんが、Julia には大いに注目しています。Julia 言語と機能の概要は、「Julia: スーパーコンピューティング向け高水準言語」をご覧ください。

この号の注目記事、「インテル® System Studio による自動運転のチューニング」では、インテル® System Studio のツールが提供する組込みシステムやコネクテッド・デバイス開発者向けの統合開発環境で、ビルド、デバッグ、パフォーマンスや消費電力のチューニングを行う方法を紹介します。エッジ・アプリケーションのチューニングをテーマとする別の記事、「クラウドおよびエッジ・アプリケーション向けの高速データ圧縮コードのビルド」では、インテル ® IPP を利用してデータ圧縮を高速化する方法を説明します。

前号の The Parallel Universe で述べたように、R は私のお気に入りの言語ではありませんが、R は優れた言語です。「インテル® DAAL による R の線形回帰の高速化」では、R のデータ解析アプリケーションでインテル® DAAL を活用する方法を説明します。最後に、この号の締めくくりとして、「インテル® C++ コンパイラーによる MySQL* の最適化」では、プロシージャー間の最適化により、データ・サイエンティストにとって重要なアプリケーションである、MySQL データベースのパフォーマンスを大幅に向上する方法を紹介します。

Henry A. Gabb インテル コーポレーション 主任エンジニア
2017 年 7 月

Parallel Universe 28号

【注目記事】

  • Parallel STL を利用してシーケンシャル C++ コードを並列コードに変換する

【掲載記事】

  • OpenMP* 誕生から 20 年
  • インテル® DAAL を利用して実際のマシンラーニングの問題を解く
  • R を使用した HPC: 基本
  • BigDL: Apache Spark* 上の最適化されたディープラーニング
- 編集者からのメッセージ -

並列言語、言語拡張、アプリケーション・フレームワーク

プログラミング言語がまだ標準化されず、コンパイラーが未熟だった頃、現在の並列コンピューティングと呼ばれるものは、その兆しすら見えていませんでした。当時は、まだニッチなテーマであり、開発者は言語拡張やライブラリー (OpenMP*、インテル ® スレッディング・ビルディング・ブロック、MPI、Pthreads など) により並列処理を表現することで満足していました。プログラミング言語の設計と並列プログラミング・モデルは、切り離して考えられ、長年にわたって別々に研究が進められました。時としてそれぞれの研究が交差したり (High-Performance Fortran、Unified Parallel C など)、一般的な言語のメモリーモデルが並列処理を安全に実装できるかどうかについて頻繁に議論されました。これらの議論や実験をとおして多くのことが学ばれました。

現在では、並列コンピューティングは至るところに存在し、主要プログラミング言語では標準になりつつあります。この号の注目記事、「Parallel STL: C++ STL コードのパフォーマンスの向上」では、次の C++ 標準 (C++17) で実装される Parallel Standard Template Library (PSTL) の概要とその使用法を示すサンプルコードを紹介します。

それ自体は並列言語ではありませんが、可搬性のあるベンダー・ニュートラルな並列プログラミング・ディレクティブとして 誕生 20 周年を迎えた OpenMP* について、この号でも引き続き取り上げたいと思います。前号では、Michael Klemm 氏 (OpenMP* Architecture Review Board の現 CEO) が最新の OpenMP* 機能を紹介してくれました。この号では、業界に精通した Rob Farber 氏が「OpenMP* 誕生から 20 年」で OpenMP* の開発の歩みを振り返り、現代における使用法 を示します。

私は特定のタスクに R を使用しますが、率直に言って R は私の好きな言語ではありません。私自身は、ハイパフォーマンス・コンピューティング (HPC) に R を使用しようと思ったことがありませんが、「R を使用した HPC: 基本」 では、テネシー大学ノックスビル校の Drew Schmidt 氏がこの人気の統計言語を HPC で使用する方法を説明しています。この記事を読み、私も R の可能性を信じるようになりました。

マシンラーニング向けの新しいソフトウェア

マシンラーニングとその親戚でありより有名なディープラーニングが、最近多くの計算サイクルを消費していることに異論はないでしょう。インテルでは、その優れたマシンラーニング・ポートフォリオに新しいソリューションを追加し続けています。最新の BigDL は、ビッグデータ環境内においてディープラーニングを促進するように設計されています。「BigDL: Apache Spark* 上の最適化されたディープラーニング」では、この新しいフレームワークの使用を支援します。「インテル® DAAL を利用して実際のマシンラーニングの問題を解く」では、インテル® DAAL ライブラリーを使用して分類とクラスタリングを行います。Kaggle の予想モデリングと解析プラットフォームの 2 つの問題を用いて、Python* と R での実装方法を示し、比較します。

Henry A. Gabb インテル コーポレーション 主任エンジニア
2017 年 7 月

Parallel Universe 27号

【注目記事】

  • 現在と将来の OpenMP* API 仕様 - 代表的な並列プログラミング言語の各バージョンにおける進化

【掲載記事】

  • 行列 - 行列乗算のパックのオーバーヘッドを減らす
  • 並列アプリケーションのスケーラビリティーの問題を特定する
  • インテル® AVX-512 で向上したベクトル化のパフォーマンス
  • インテル® Advisor のルーフライン解析
  • インテルが推進するディープラーニング・フレームワーク
- 編集者からのメッセージ -

OpenMP* 20 周年

OpenMP* アプリケーション・プログラミング・インターフェイスが 20 周年を迎えることを記念して、Michael Klemm (OpenMP* Architecture Review Board (ARB) の現 CEO) と彼の同僚が、最新の機能の概要、特にタスクベースの並列処理の拡張と専用アクセラレーターへの計算のオフロードについて話してくれました。

詳しい内容は注目記事「現在と将来の OpenMP* API 仕様」をご覧いただくとして、ここでは OpenMP* の歴史について簡単に述べたいと思います。私は冗談半分で、1990 年代前半はハイパフォーマンス・コンピューティング (HPC) にとって「嫌な時代」であったと言うことがあります。当時、急速に変わりつつある HPC 分野では、多数の並列プログラミング・モデルと並列アーキテクチャーが点在していました。分散メモリー・アーキテクチャーでは、SHMEM のような低レベルのメッセージパッシング手法、PVM や MPI のような高レベルのメッセージパッシング手法、そして High Performance Fortran や Unified Parallel C によるさらに高レベルの抽象化がありました。共有メモリー・アーキテクチャーでは、pthreads のような低レベルのスレッド化手法や高レベルのコンパイラーに指示する並列化がありました。1 つはっきりしていたことは、実際のアプリケーションを自動的に並列化できる魔法のようなコンパイラーはないということでした。次善の策として、並列コンパイラー・ディレクティブがありました。

OpenMP* が登場する前の並列コンパイラー・ディレクティブをご存知の方は、ベンダー (Cray*、SGI*、インテル、Kuckand Associates, Inc. など) ごとに異なるセットがあり、それぞれが同じことを異なる構文で行っていたことを記憶されているでしょう。

その後、いくつかの主要な政府系 HPC 施設が並列コンパイラー・ディレクティブ構文の統一を要求したことで、1997 年に OpenMP* が誕生しました。設立時のベンダーのほとんどが現在も ARB に残っており、その後多数のメンバーが加わりました (ARB は現在 29 のメンバーで構成されています)。OpenMP* は、当初の目的を見失うことなく、可搬性のあるベンダー・ニュートラルな並列プログラミング・ディレクティブとして不動の地位を確立しています。今日、HPC 分野におけるほとんどのアプリケーション要件は MPI と OpenMP* で対応できます。しかし、まだ課題があります。メモリー・サブシステムはこれまでになく不均衡で、同じシステムに異なるプロセッサー・アーキテクチャーが存在することは珍しくなく、異なる処理要素間でデータの一貫性を保持することが、プログラマーの負担となっています。ただし、これらの課題に対応するべく MPI と OpenMP* は進化を続けており、HPC の未来は明るいと言えるでしょう。

Henry A. Gabb インテル コーポレーション 主任エンジニア
2017 年 1 月

Parallel Universe 26号

【注目記事】

  • インテル® Xeon Phi™ プロセッサー向けのコードの現代化

【掲載記事、事例】

  • ビッグデータ解析とマシンラーニングの有効利用
  • マシンラーニングにおける Python* パフォーマンスの壁を乗り越える
  • インテル® VTune™ Amplifier XE による Java* および Python* コードのプロファイル
  • 電光石火の R マシンラーニング・アルゴリズム
  • データ解析およびマシンラーニング向けパフォーマンス・ライブラリー
  • インテルのハイパフォーマンス・ライブラリーにより MeritData 社が Tempo* ビッグデータ・プラットフォームをスピードアップ
- 編集者からのメッセージ -

マシンは私たちから何を学ぶのでしょうか?

プログラミングとは? 皆さんご存知のとおり、コンピューター上でタスクを実行するため、開発者が記述する一連の明示的な論理命令です。しかし、これが変わりつつあります。近年、マシンラーニング分野は、科学、商業、産業、消費者によるコンピュート・プラットフォームと関連センサーの利用によって生成される膨大な量のデータから、価値のあるデータと詳細を抽出するため、重要性が増しつつあります。

マシンラーニング・アルゴリズムの実装には、特定のパターンを認識するようにトレーニングされたニューラル・ネットワークを使用します。例えば、プログラムに木を認識させる場合、枝、幹、葉を探すように明示的にプログラミングする代わりに、木のイメージを提供します。ニューラル・ネットワークが木のイメージを正しく認識できない場合は、プログラムを変更するのではなく、さらに多くの木のイメージを与えてトレーニングします。

開発者にとって今後の課題は、マシンラーニング手法の理解と実装を、最適なパフォーマンスと結果をプログラムに教える能力と組み合わせることです。

どのように取り掛かればよいのでしょうか?

最近リリースされたインテル® Parallel Studio XE 2017 を利用すると良いでしょう。インテル® Parallel Studio XE 2017 は、マシンラーニング関連の開発作業を支援する多くの新機能を提供します。新製品のインテル® Distribution for Python* は、インテル ® マス・カーネル・ライブラリー (インテル® MKL)、インテル® Data Analytics Acceleration Library (インテル® DAAL)、インテル® MPI ライブラリー、インテル® スレッディング・ビルディング・ブロック (インテル® TBB) などを利用して、NumPy*、SciPy*、scikit-learn のようなパッケージを高速化できます。インテル® MKL とインテル® DAAL は、最適化された畳み込み、プーリング、K 平均法、交互最小 2 乗 (ALS) を含むマシンラーニング開発向けの基本的なビルディング・ブロックを提供します。解析では、インテル® VTune™ Amplifier XE を利用することで、Python* コードと Python* と C/C++ 混在コードのプロファイルにより hotspot を特定できます。

本号の The Parallel Universe では、引き続きツールとライブラリーの概要とマシンラーニングでの利用法を紹介します。また、最近リリースされたインテル® Xeon Phi™ プロセッサー (開発コード名 Knights Landing) の最新機能を理解し、利用できるように支援します。従来のプログラミングを継続し、エクサスケール、さらにその先へ向かいつつある中、マシンラーニングの発展とそれらを支える手法は、プログラマーに新たな機会と課題をもたらします。次世代のコンピューターをトレーニングする頃には、プログラミングの概念が変わるかもしれません。

Mike Lee
2016 年 10 月

Parallel Universe 25号

【注目記事】

  • インテルと Anaconda* によるオープン・データ・サイエンス向けPython* の強化

【掲載記事】

  • インテル® VTune™ Amplifier XE を利用した Python* コードの高速化
  • インテル® MPI ライブラリーを利用した Python* の並列プログラミング
  • 間接呼び出しと仮想関数の呼び出し: インテル® C/C++ コンパイラー 17.0 によるベクトル化
- 編集者からのメッセージ -

HPC の大衆化

Python* は、その単純性、構文の表現力、豊富なライブラリーにより、脚光を浴びています。このオープンソース・プログラミング言語は、特にデータ解析とマシンラーニングの分野で広く採用されています。では、開発者は、Python* の生産性の利点と並列コンピューティングでのみ実現できるパフォーマンスをどのように組み合わせれば良いのでしょうか。

まず手始めに、インテルは、インテル® マス・カーネル・ライブラリーを活用して Python* パッケージのパフォーマンスを引き出す、ベータ版 インテル® Distribution for Python* をリリースしました。また、インテル® VTune™ Amplifier XE のような一般的なツールにも Python* のサポートを追加しています。最新バージョンのインテル® VTune™ Amplifier XE (インテル® Parallel Studio XE 2017 に含まれています) では、Python* コードとネイティブ C/C++ コードテンションが混在したアプリケーションの隠れたパフォーマンス hotspot を特定できるようになりました。

この号では、これらのツールの一部を取り上げています。注目記事、「インテルと Anaconda* によるオープン・データ・サイエンス向け Python* の強化」では、ビッグデータ・プロジェクトを始めたばかりの開発者でも利用できる、最先端のオープンデータ・サイエンス・プラットフォーム Anaconda* について説明します。「インテル® VTune™ Amplifier XE を利用した Python* コードの高速化」では、Python* コードのプロファイルと最適化について説明します。また、「インテル ® MPI ライブラリーを利用した Python* の並列プログラミング」では、HPC で最もよく使用されているプログラミング・モデルと Python* を組み合わせた並列プログラミングの方法について説明します。

これらの弛まぬ努力は、インテル® Xeon® プロセッサーおよびインテル® Xeon Phi™ プロセッサー/コプロセッサーの真の実力を引き出せるように開発者を支援するという目的だけでなく、テクニカル・コンピューティングと HPC の大衆化におけるリーダーとしてインテルがより大きな使命を果たすためにも役立っています。Parallel Universe では、並列コンピューティングの最も注目されるユースケースを紹介するように努めていますが、現在のスーパーコンピューターの技術は 10 年も経たないうちにありふれたものになり、その後しばらくすると日常に溶け込んでいることでしょう。HPC の大衆化は非常に喜ばしいことです。技術の成熟とともに、インテルはハイパフォーマンス・システムをより利用しやすくする方法を見つけ出しています。このインテルの取り組みは、そのようなコンピューターを利用する、より先進的な科学/エンジニアリングに活力を与えます。そして、これらの技術が、形を変えて我々の将来を明るく照らすことになるのです。

James Reinders
2016 年 7 月

バックナンバー

Parallel Universe 24号

- 生産性と C++ パフォーマンスの向上 -
  • 生産性と C++ パフォーマンスの向上
  • インテル® C++ コンパイラー Standard Edition for Embedded Systems with Bi-Endian Technology
  • OpenMP* API バージョン 4.5: 標準化の進化
  • インテル® MPI ライブラリー: Hadoop* エコシステムのサポート
  • メモリーアクセスのパフォーマンス・ボトルネックの検出
  • インテル® IPP を利用した画像識別の最適化
  • 最新の IoT と組込みテクノロジーを利用したスマートな開発
  • インテルのクラスターツールを利用したハイブリッド・アプリケーションのチューニング
  • インテル® Advisor 2016 を利用したコードのベクトル化

Parallel Universe 23号

- パフォーマンスを向上する最適なツールの選択 -
  • 最適なツールの選択 - アプリケーションのパフォーマンスを向上するためのロードマップ
  • 将来の HPC 問題に向けたコードの現代化
  • ベクトル化アドバイザーのヒントの活用
  • 画像処理の最適化
  • 音声認識パフォーマンスの向上
  • サブモジュールによる Fortran 開発者の生産性の向上

Parallel Universe 22号

- ベクトル化特集 -
  • OpenMP* SIMD によるベクトル・プログラミング -
    インテル ® Xeon® プロセッサー、インテル® Xeon Phi™ コプロセッサー、インテル® GPU 向け
  • ベクトル化アドバイザー: ベクトル化を支援する新しいツール

Parallel Universe 21号

- MPI (メッセージ・パッシング・インターフェイス): 分散メモリーシステムの標準規格 -
  • MPI-3 共有メモリー・プログラミング入門:
    MPI/OpenMP* プログラミングに代わるハイブリット並列プログラミング
  • インテル® MPI ライブラリーの条件付き再現性
  • インテル® MPI のメモリー消費

Parallel Universe 20号 - Knights Corner から Knights Landing へ: 次世代のインテル® Xeon Phi™ プロセッサー/コプロセッサーに備える -
  • 次世代のインテル® Xeon Phi™ プロセッサー/ コプロセッサー、Knights Landing への道のり
  • インテル® VTune™ Amplifier XE による OpenMP* 領域の解析
  • ウォーカー分子動力学研究室のバイオメディカル・ソフトウェアの最適化
  • インテル® ソフトウェア開発製品が HPCwire アワードを獲得
目次 PDF
Parallel Universe 19号 インテル® Paralell Studio XE 2015 リリース / パフォーマンスの最適化 / スケーラブルな設計
  • 最適化レポート: インテル® コンパイラーによりパフォーマンスを向上
  • マルチコアからメニーコアまでスケーラブルなパフォーマンスの設計
  • インテル® アドバンスト・ベクトル・エクステンション 512 (インテル® AVX-512) に追加された命令
  • Digimarc 社が新たに実現した電子透かしの埋め込み
  • 『High Performance Parallelism Pearls』
目次 PDF
Parallel Universe 18号 インテル® TBB のフローグラフ / スペキュレーティブ・ロック / タスク領域
  • MIT から GCC* メインラインへと進化を遂げたインテル® Cilk™ Plus
  • インテル® スレッディング・ビルディング・ブロック (インテル® TBB) のフローグラフ、スペキュレーティブ・ロック、タスク領域
  • MPI の標準化から 20 年:
    共通のアプリケーション・バイナリー・インターフェイスの実現
  • 新しい MPI-3 標準でパフォーマンスの課題に対処する
  • OpenMP* 年表
  • インテル® アーキテクチャーにおける OpenCL* 投資の活用
目次 PDF
Parallel Universe 17号 オープンソース Python*、R、Julia ベースの HPC アプリケーションの高速化
  • オープンソース Python*、R、Julia ベースの HPC アプリケーションの高速化
  • インテル® VTune™ Amplifier XE によるマルチスレッド化とタスク解析
  • スレッド・パフォーマンスをスピードアップ:
    インテル ® C++ コンパイラーによるインテル® TSX のサポート
  • Tachyon レイトレーサー:
    インテル ® Xeon Phi™ コプロセッサーへの移植
  • インテル® C++ コンパイラーによるネイティブ Android* アプリケーションのビルド
目次 PDF
Parallel Universe 16号 フルスロットル : OpenMP* 4.0、インテル® Cluster Studio XE 2013 SP1 の新機能
  • インテル® Cluster Studio XE 2013 SP1 の新機能
  • フルスロットル : OpenMP* 4.0
  • MPI 通信のプロファイリング ̶ ハイパフォーマンスのためのテクニック
  • インテル® Parallel Studio XE によるビデオ会議ソフトの高速化
目次 PDF
Parallel Universe 15号 効率良いソフトウェア開発
  • 効率良いソフトウェア開発:
    インテル ® Parallel Studio XE 2013 SP1 の新機能
  • インテル® Parallel Studio XE のコプロセッサー・デバッグのサポート
  • フルスケーリングに向けて:
    WRF (Weather Research and Forecast) モデルとインテル® Cluster Studio XE 2013
目次 PDF
Parallel Universe 14号 開発ツールの分岐点
  • インテル® System Studio: インテリジェント・システム向け総合開発ソリューション
  • ショックウェーブ! CloverLeaf とインテル® Xeon Phi™ コプロセッサーの巡り合い
  • インテル® Xeon Phi™ コプロセッサーとインテル® MPI ライブラリーのプログラミング・モデル
  • 従来のシリアル処理から並列処理へ: インテル® Cilk™ Plus による実用アプリケーションの変換
目次 PDF
Parallel Universe 13号 ソフトウェアが切り拓く未来
  • プロダクト・エンジニアリングの革命:
    高速かつ正確な有限要素解析 (FEA)
  • パラレルパワー:
    インテル ® Xeon Phi™ コプロセッサー用ソフトウェアの最適化
  • インテル® Xeon Phi™ コプロセッサーのパフォーマンスを解き放つ
  • OpenMP* アプリケーションのチューニング
  • さまざまなデバッグオプション
  • HTML5 を利用した並列実行
目次 PDF
Parallel Universe 12号
(英語)
Shedding Light on Cluster Performance with LAMMPS
  • Shedding Light on Cluster Performance with LAMMPS
  • Checklist for Programming Intel® Xeon Phi™ Coprocessors,
  • Advanced Vectorization
  • Optimizing Correlation Analysis of Financial Market Data Streams Using Intel® Math Kernel Library
目次 PDF
Parallel Universe 11号 インテル® Parallel Studio XE 2013 - パフォーマンスを向上させる 10 項目の機能
  • インテル® Parallel Studio XE 2013:
    パフォーマンスを向上させる 10 項目の機能
  • インテル® ソフトウェア開発ツールを使用した HMMER の解析
  • ポインターチェッカー: 範囲外のメモリーアクセスの迅速な検出
  • インテル® (Visual) Fortran Composer XE の新しい並列プログラミング機能
  • インテル® マス・カーネル・ライブラリー (インテル® MKL) とインテル® コンパイラーを使用し、実行するたびに数値再現性のある結果を取得
目次 PDF
Parallel Universe 10号 6 ステップのベクトル化による将来も通用するアプリケーションの生成
  • 6 ステップのベクトル化による将来も通用するアプリケーションの生成
  • さまざまな環境に応じた並列計算
  • .NET アプリケーションの信頼性とパフォーマンスを高めるツール
目次 PDF
Parallel Universe 9号 DreamWorks Animation ファーシェーダーの並列化
  • DreamWorks Animation* のファーシェーダーの並列化
    インテルのツールによる大規模アプリケーションの並列化の支援
  • インテル® Cluster Studio XE の新しい解析ツール
目次 PDF
Parallel Universe 8号 HPC 事例: 生物物理学者と数学者が支持するインテル® Parallel Advisor を使用した並列化
  • HPC 事例: 生物物理学者と数学者が支持するインテル® Parallel Advisor を使用した並列化
  • インテル® スレッディング・ビルディング・ブロックのフローグラフ
  • インテル® Parallel Studio XE SP1
目次 PDF
Parallel Universe 7号 インテル® Cilk™ Plus: 並列プログラミングのための C/C++ 言語拡張
  • インテル® Cilk™ Plus : 並列プログラミングのための C/C++ 言語拡張
  • インテル® Parallel Building Blocks( インテル® PBB) の 3 つの ‘for’ ループ
  • シリアル/ 並列アプリケーションのパフォーマンス解析の簡素化
  • ケーススタディー : マサチューセッツ総合病院*
目次 PDF
Parallel Universe 6号 並列モデルを使用したインテル® IPP 関数の並列化
  • インテル® Cilk™ Plus とインテル® スレッディング・ビルディング・ブロックを使用したインテル® インテグレーテッド・パフォーマンス・プリミティブ関数の並列化
  • インテル® Array Building Blocks コーディング・ヒント
  • 導入事例の紹介
目次 PDF
Parallel Universe 5号 ハイパフォーマンスを容易に実現するインテル® Parallel Studio XEおよびインテル® Cluster Studio ツールスイート
  • インテル® Parallel Studio XE およびインテル® Cluster Studio
  • インテル® Parallel Building Blocks
  • インテル® Array Building Blocks
  • インテル® マス・カーネル・ライブラリー (インテル® MKL)
  • Print ステートメントとタイマーだけでは見つけられない問題の検出:
    より有効的な並列化への投資
目次 PDF
Parallel Universe 4号 インテル® Parallel Studio 2011: アプリケーションのマルチコア対応がより簡単に
  • インテル® Parallel Studio 2011:
    アプリケーションのマルチコア対応がより簡単に
  • 世界初のヒント数 39 の究極数独問題
目次 PDF
Parallel Universe 3号
(英語)
Enhancing Productivity and with Intel® Cluster Toolkit Compiler Edition Achieving High Performance
  • Enhancing Productivity and Achieving High Performance with Intel® Cluster Toolkit Compiler Edition
  • Increase Productivity and Performance:
    Find out What IncrediBuild* and Intel® Parallel Composer Can Offer
  • Optimizations for MSC.Software SimXpert* Using Intel® Threading Building Blocks
目次 PDF
Parallel Universe 2号 Think Parallel: 優れたプログラミングは開発者から始まる
  • Think Parallel: 優れたプログラミングは開発者から始まる
  • Where Are My Threads?
    インテル ® VTune™ パフォーマンス・アナライザーを利用したスレッド化問題と並列化問題の検出
  • インテル® Parallel Inspector
    サンプル・プロジェクトを通じて機能を理解する
  • ADVISOR ORIGINS
目次 PDF
Parallel Universe 1号 Parallel Universe へようこそ
  • THINK PARALLEL or PERISH
    マルチコア時代を生き抜くソフトウェア開発者とは
  • 安全な並列コードの記述
  • Parallel Universe ~並列処理の世界~へ足を踏み入れる準備はできていますか
    マルチコア向けのアプリケーションの最適化
  • マルチコア向け並列プログラミングの 8 つのルール
目次 PDF

インテル® ソフトウェア開発製品の利用方法に関するドキュメントや参考情報を、開発上の課題別に掲載します。
※旧バージョンの製品を使用した内容であっても、基本的には最新バージョンの製品で活用できます。

製品略称 (PSXE、ISS など) の説明は こちら
インテル® Xeon® プロセッサーとインテル® Xeon Phi™ プロセッサーにおけるディープラーニング訓練と推論 パフォーマンスの向上
このホワイトペーパーでは、フレームワークのコードを変更することなく、インテル® Xeon® プロセッサーおよびインテル® Xeon Phi™ プロセッサー上でオープンソースの TensorFlow* と Caffe のディープラーニング訓練/推論のパフォーマンスを (最大 2 倍/最大 2.7 倍) 向上する方法を紹介します。システムレベルの最適化により、画像認識畳み込みニューラル・ネットワーク (CNN) ワークロードのスループットの向上と訓練時間の削減を実現します。
説明 PDF
MPI: チュートリアル: MPI/OpenMP* ハイブリッド・アプリケーションの解析
インテル® Parallel Studio XE を使用して非効率な MPI コードを確認し、スレッドのロードバランスを取ることによりハイブリッド・アプリケーションをチューニングする方法を説明します。
説明 PDF
PSXE/ISS: マシンラーニングにもスムーズに対応 - インテル® ソフトウェア・ツールで生産性とパフォーマンスを向上 資料
インテル® ソフトウェア開発ツールを使うことで、世の中に幅広く普及するマシンラーニング・テクノロジーの複雑な機能や処理を、簡単に効率良く開発できるようになります。

本資料では、ソフトウェア開発ツール インテル® Parallel Studio XE およびインテル® System Studio に含まれるマシンラーニング対応のツールやライブラリーの機能紹介に加え、マシンラーニング向けのソフトウェア開発に関するさまざまな情報を紹介しています。 これらのツールは、パフォーマンス向上と開発期間の短縮を実現し、マシンラーニングのすべてのワークフローをカバーします。
説明 PDF
PSXE: Intel 社 Webinar「高速なコードを素早く開発、インテル® Parallel Studio XE 2017 新機能紹介」資料
インテル® Parallel Studio XE 2017 の新機能、新たにサポート対象となった標準規格、OS、インテル® プロセッサーの情報に加え、本製品に含まれるコンパイラー、ライブラリー、解析ツールのパフォーマンス・ベンチマークが紹介された Webinar の資料を日本語化しました。
説明 PDF
PSXE: Intel 社 Webinar「インテル® ライブラリーによるディープラーニングとマシンラーニングの促進」資料
2 つのインテル® パフォーマンス・ライブラリー、「インテル® MKL」と「インテル® DAAL」が提供する最適化済みのビルディング・ブロックを使って、データ解析とディープラーニング/マシンラーニングを高速化するための Intel 社のWebinar コースの資料を日本語化しました。
各ライブラリーの概要、機能、パフォーマンス・ベンチマーク、コンポーネントなどを紹介しております。
説明 PDF
PSXE: インテル® C++/Fortran コンパイラー 17.0 最適化クイック・リファレンス・ガイドおよびインテル® VTune™ Amplifier XE 2017 の概要

インテル® コンパイラー 17.0 で使用できるオプションの一覧です。本改訂版では、パフォーマンス解析ツール インテル® VTune™ Amplifier XE の機能紹介が追加されています。

説明 PDF
iSUS 関連ページ (インテル® Modern Code)

米インテル社の Intel® Modern Code (英語) の参考訳をもとにしたページです。

マルチレベルの並列処理は、ベクトル化、マルチスレッド、そしてマルチノードの最適化を通じて、近年のハードウェア上で利用可能な並列パフォーマンスの機能をすべて活用するフレームワークです。今日と将来のハードウェア向けに効率良くスケールする並列アルゴリズムを作成する方法を模索します。

説明 WEB
iSUS 関連記事一覧 (最適化、並列化、ベクトル化)
説明
PSXE: インテル® Fortran コンパイラーによる効果的な並列処理の最適化
インテル® Fortran コンパイラー 16.0 を使って、自動ベクトル化/並列化、OpenMP 4.5 による明示的な SIMD プログラミングンついて紹介した Webinar コースの資料を日本語化したものです。

開催された Webinar の種類については、iSUS の記事をご覧ください。

説明 PDF
PSXE: スレッド化されていないアプリケーションでも大幅なパフォーマンス向上を容易に実現
本ガイドは、インテル® Parallel Studio XE を使用してアプリケーション中の「hotspot」(多くの時間を費やしているコード領域) を見つけ、それらの領域を再コンパイルすることでアプリケーション全体のパフォーマンスを向上する方法について説明します。
説明 PDF
PSXE: インテル® Cilk™ Plus による並列化への近道

インテル® Cilk™ Plus は、インテル® C++ コンパイラーで実装される C/C++ 言語にシンプルな言語拡張を追加して、データとタスクの並列化を表現します。インテル® C++ コンパイラーは、インテル® Parallel Studio XE に含まれます。

本ガイドは、インテル® Cilk™ Plus を使用して、簡単にコードをベクトル化および並列化 (スレッド化) する方法について説明します。機能の概要を紹介し、エンドツーエンドの例を用いて使用方法を示します。

説明 PDF
PSXE: 並列化による既存プログラムの最適化

このガイドでは、インテル® Parallel Studio XE に含まれる強力なスレッド・ライブラリーを使用して既存のアプリケーションを並列化する方法を説明します。

最初に、サンプルコードを利用して、インテル® TBB のパワフルな機能を説明します。次に、インテル® Parallel Studio XE を活用した 6 つのプロセスによりアプリケーションを並列化する手順を説明します。最後のセクションには、スレッド化に役立つ重要な情報が含まれています

説明 PDF
PSXE: 間接呼び出しと仮想関数の呼び出し:インテル® C/C++ コンパイラー 17.0 によるベクトル化 (Parallel Universe 25号)

インテル® C++ コンパイラー 17.0 (インテル® Parallel Studio XE 2017 に含まれる) では、ベクトル化方式の SIMD 対応関数の間接呼び出しがサポートされました。

  • 本記事は、並列化マガジン Parallel Universe 25 号の記事の 1 つです
説明 PDF
PSXE: 生産性と C++ パフォーマンスの向上 (Parallel Universe 24号)

インテル® C++ コンパイラーに追加された新しいテンプレート・ライブラリー、インテル® SDLT は、C++ コードを最適化して SIMD 効率の向上を支援します。

  • 本記事は、並列化マガジン Parallel Universe 24 号の記事の 1 つです
説明 PDF
PSXE: 最適なツールの選択 (Parallel Universe 23号)

この記事では、ハードウェアから最高のパフォーマンスを引き出すための手法を推奨します。アプリケーションのスレッド化とベクトル化に加えて、メモリー階層を最大限に活用することも重要です。そうしないと、スレッド化やベクトル化によるメモリー・トラフィックの増加がボトルネックになってしまいます。また、MPI を使用してノード間の並列処理をチューニングする方法についても説明します。

  • 本記事は、並列化マガジン Parallel Universe 23 号の記事の 1 つです
説明 PDF
PSXE: 将来の HPC 問題に向けたコードの現代化 (Parallel Universe 23号)

HPC ソフトウェア開発者、ドメイン・スペシャリスト、データ・サイエンティストに役立つことが分かった、コードの現代化 (さらなる並列プログラミング) についてのヒントを紹介します。

  • 本記事は、並列化マガジン Parallel Universe 23 号の記事の 1 つです
説明 PDF
PSXE: 最適化レポート: インテル® コンパイラーによりパフォーマンスを向上 (Parallel Universe 19号)

インテル® Parallel Studio XE 2015 のコンパイラーによる最適化レポートは、コードのチューニングとパフォーマンスの向上に役立ちます。利用可能なレポートデータの種類とアプリケーションへの適用方法を紹介します。

  • 本記事は、並列化マガジン Parallel Universe 19 号の記事の 1 つです
説明 PDF
IPP: インテル® IPP を使用したアプリケーションの最適化
インテル® IPP を使用してアプリケーションにベクトル化を実装する方法と、インテル® IPP API の使用方法を説明します。また、インテル® TBB およびインテル® Cilk™ Plus を使用して、インテル® IPP アプリケーションにスレッド化を実装するサンプルも紹介します。
説明 WEB
TBB: インテル® TBB による効率良いスレッド化

インテル® TBB は広く使用されている C++ テンプレート・ライブラリーであり、安定性を備え、移植性とスケーラビリティーに優れた並列アプリケーションの作成を支援します。インテル® TBB を利用することで、さまざまな環境でマルチコアおよびメニーコア・プロセッサーの能力を最大限に活用し、パフォーマンスを引き出すことができるだけでなく、保守も容易な優れたタスクベースの並列アプリケーションを簡単に短期間で開発できます。

このガイドでは、インテル® Parallel Studio XE に含まれるインテル® TBB を使用して効率良くスレッド化する方法を説明します。

説明 PDF
Advisor: より少ないリスクで大きな効果が得られる並列パフォーマンスの設計
本ガイドでは、インテル® Advisor を使用して、シリアル・アプリケーションを並列化する方法を説明します。最初に、サンプルコードを使って実際にインテル® Advisor を操作しながら、その強力な機能について説明します。その後、ユーザー自身でほかのインテル® Parallel Studio XE のコンポーネントを試してみてください。最後のセクションには、スレッド化に役立つ重要な情報が含まれています。
説明 PDF
Advisor: インテル® Advisor 2016 を利用したコードのベクトル化 (Parallel Universe 24号)

ベクトル化アドバイザーの概要を提供し、次世代のインテル® Xeon Phi™ 製品 (開発コード名 Knights Landing) 上でのベクトル化を支援する新しい機能を紹介します。また、ベクトル化アドバイザーを利用して一般的な問題をベクトル化する方法を示します。

  • 本記事は、並列化マガジン Parallel Universe 24 号の記事の 1 つです
説明 PDF
Advisor: ベクトル化アドバイザー (Parallel Universe 22号)

インテル® Advisor は、ダイナミック解析、スタティック・バイナリー解析、コンパイラー・レポートを組み合わせます。利用可能なデータソースをほぼすべて活用して、ユーザーコードに関する最も包括的な情報 (CPU 時間、ループのトリップカウント、ベクトル長と命令セット、メモリー・アクセス・パターンなど) を提供します。インテル® Advisor はまた、詳細な統計を利用した、ボトルネックを解消するための推奨事項を示します。

この記事では、サンプルコードでインテル® Advisor を使用してベクトルコードを最適化する方法を説明します。

  • 本記事は、並列化マガジン Parallel Universe 22 号の記事の 1 つです
説明 PDF
Advisor: マルチコアからメニーコアまでスケーラブルなパフォーマンスの設計 (Parallel Universe 19号)

インテル® Advisor 2015 は、設計をモデル化し、パフォーマンス・スケーリングと同期の問題を予測するためのフレームワークを提供します。インテル® Advisor 2015 のモデル化をインテル® Xeon Phi™ コプロセッサーに拡張する方法を示します。

  • 本記事は、並列化マガジン Parallel Universe 19 号の記事の 1 つです
説明 PDF
MPI: インテル® MPI ライブラリーを利用した Python* の並列プログラミング (Parallel Universe 25号)

分散メモリーシステムの HPC で最もよく使用されているプログラミング・モデルである、メッセージ・パッシング・インターフェイス (MPI) と Python* を組み合わせた並列プログラミングの方法について説明します。

  • 本記事は、並列化マガジン Parallel Universe 25 号の記事の 1 つです
説明 PDF
MPI: MPI/OpenMP* プログラミングに代わるハイブリット並列プログラミング (Parallel Universe 21号)

MPI-3 規格は、ハイブリッド・プログラミングに新しい MPI 共有メモリー (SHM) モデルを使用するアプローチをもたらします。1 インテル® MPI ライブラリー 5.0.22 でサポートされた MPI SHM モデルは、既存の MPI コードをベースにわずかな変更を加えることで、共有メモリーノードのプロセス間の通信を高速化できます。3

この記事では、インテル® Xeon® プロセッサーとインテル® Xeon Phi™ コプロセッサー・ベースのマルチノード・システムで MPI SHM を利用する方法を紹介します。

  • 本記事は、並列化マガジン Parallel Universe 21 号の記事の 1 つです
説明 PDF
Media: Intel 社 Webinar「最新のインテル® プロセッサー向けメディア・ソリューション/アプリケーションの開発」資料

Happy Together:インテル プロセッサー+ソフトウェアによる画期的なメディアパフォーマンス。
最新のインテル社のハードウェアとメディア・ソフトウェアが連携して、メディア・ワークロードやビデオ・ストリーミングの高速かつ高品質な結果を得ることができます。
これらのプラットフォームを活用し、インテル ® Xeon® プロセッサー E3-1500v5 および第 6 世代インテル® Core™ プロセッサー(開発コードネーム:Skylake)のハードウェア・アクセラレーション・コーデックへのアクセス方法を学びます。
主なトピックは、下記の通りです。

  • インテル® Media Server Studio またはインテル® Media SDK を使用して、HEVC、AVC および MPEG-2 のメディア・ソリューションおよびアプリケーションを最適化
  • 1台のプラットフォームでリアルタイム 4K@60fps HEVC、最大 18 AVC HD@30fps トランスコード・セッションを達成
  • インテル® グラフィックス・プロセッサー(GPU)で最大の性能向上を実現
  • ショートカットのためのスキニーを取得し、結果を速く確認
説明 PDF
PSXE: Intel 社記事「ベクトル化とインテル® Xeon® スケーラブル・プロセッサーを使用したパフォーマンスの向上」
この記事は、2018 年 6 月 12 日時点の、インテル® デベロッパー・ゾーンに公開されている「Improve Performance Using Vectorization and Intel® Xeon® Scalable Processors」の日本語訳です。
ソフトウェアのパフォーマンスを高めるニーズは増加の一途を辿っていますが、以前のように ハードウェアのクロック速度を上げることでパフォーマンスを向上させることはできません。その代わりに、ソフトウェア・アプリケーションが複数のコアで並列処理を使用し、各コアで SIMD (Single Instruction、Multiple Data) アーキテクチャーやベクトル・プロセッサーにより増加した実行ユニットを活用する必要があります。本資料では、以下のトピックについて解説しています。
  1. ベクトル化の基本
  2. インテル® アドバンスト・ベクトル・エクステンション 512 (インテル® AVX-512): ベクトル処理能力を向上
  3. ベクトル化を先に行う
  4. 例: アメリカンオプションの価格計算
説明 PDF
PSXE/ISS: Intel 社記事「Parallel STL 入門ガイド」
この記事は、2018 年 6 月 12 日時点の、インテル® デベロッパー・ゾーンに公開されている「Getting Started with Parallel STL」の日本語訳です。
Parallel STL は、一般に C++17 と呼ばれる C++ 標準の次期バージョンの Working Draft N4659 で指定されている、実行ポリシーをサポートする C++ 標準ライブラリー・アルゴリズム の実装です。この実装は、ISO C++ Working Group Paper P0076R3 で指定されている、順序 関係が存在しない実行ポリシーもサポートしています。
Parallel STL は、インテル® プロセッサー向けアルゴリズムの並列実行とベクトル実行の両方を効率的にサポートします。シーケンシャル実行は、C++ 標準ライブラリーの利用可能な実装に依存します。インテル ® Parallel Studio XE およびインテル® System Studio の一部として利用できます。本資料では、以下のトピックについてステップに沿って解説しています。
  1. 使用のための準備
  2. Parallel STL の使用
  3. サンプル
  4. 実装されているアルゴリズム
説明 PDF
iSUS 関連記事一覧 (解析、エラー検証、デバッグ)
説明
PSXE: スタティック解析によるコード品質の向上

スタティック解析は、ソースコードの詳細な解析を通じてエラーとセキュリティーの脆弱性を発見します。

本ガイドは、インテル® Parallel Studio XE のスタティック解析機能について説明する入門チュートリアルです。機能の概要を紹介し、エンドツーエンドの例を用いて使用方法を示します。

説明
VTune: ホスト OS 別 - 入門ガイド (バージョン 2017)

製品概要、製品を使い始めるにあたって必要な準備、ツールの起動から解析実施までの基本ステップ、製品の各種トレーニング、ドキュメントへのリンクなど、各ホスト OS でインテル® VTune™ Amplifier XE を使い始めるに当たって、お役立ていただける情報をご紹介しています。

説明
VTune: パフォーマンス解析入門ガイド
パフォーマンス・チューニングを行うにあたり理解しておきたい基本用語をはじめ、インテル® VTune™ Amplifier 2017 の概要や、ツールを使ったプログラムの最適化作業の流れ、基本的な解析タイプとその特徴などをご紹介しています。
説明 PDF
VTune: OpenMP* アプリケーションをプロファイルする
インテル® VTune™ Amplifier XE は、OpenMP コードのパフォーマンス上のボトルネックを検出する際に非常に役立ちます。OpenMP アプリケーションをプロファイルする手順を示し、このツールで検出できる一般的なパフォーマンスの問題を説明します。
説明 PDF
VTune: インテル® VTune™ Amplifier XE を利用した Python* コードの高速化 (Parallel Universe 25号)

Python* スクリプトを解析してアプリケーションで時間が費やされている場所を正確に特定できるようになりました。この新しいインテル® VTune™ Amplifier XE の Python* 機能の使用方法について説明します。

  • 本記事は、並列化マガジン Parallel Universe 25 号の記事の 1 つです
説明 PDF
VTune: OpenMP* 領域の解析 (Parallel Universe 20号)

この記事では、インテル® VTune™ Amplifier により特定できる OpenMP* の非効率性の種類と、それらの対応方法を説明します。

  • 本記事は、並列化マガジン Parallel Universe 20 号の記事の 1 つです
説明 PDF
Advisor: ベクトル化/スレッド化アドバイザー GUI 使用方法&入門ガイド

インテル® Advisor 2017 に含まれるベクトル化アドバイザー、スレッド化アドバイザーの基本機能をはじめ、各ホスト OS (Windows® / Linux*) での GUI の使用方法や解析手順を説明します。

説明
Inspector: ホスト OS 別 - 製品入門ガイド (バージョン 2017)
インテル® Inspector は、Windows* および Linux* オペレーティング・システムでシリアル/マルチスレッド・アプリケーションを開発しているユーザー向けの、動的メモリー/スレッドエラー検証ツールです。スタンドアロンまたは以下の製品の一部として利用できます。 本ガイドは、インテル ® Inspector を Linux ホスト OS で使用するためのアプリケーションに適用できるエンドツーエンドのワークフローを要約した入門ガイドを抜粋したものです。
説明
Inspector: リソースリークを解決して安定性を向上

リソースリークとは、リソース消費の 1 つで、プログラムが割り当てたリソースを解放していない状態を指します。通常、一般的なリソース問題 (メモリーリークなど)やコードの不具合による結果として起こりますが、非常に限られた状況や、長い間アプリケーションを使用した場合に問題を引き起こします。

本ガイドは、インテル® Inspector を使用してプログラム中のリソースリークを検出、修正して、問題を未然に防ぐ方法について説明します。

説明 PDF
Inspector: メモリーエラーを排除してプログラムの安定性の向上
このガイドでは、インテル® Inspector の分析ツールを使用して、コードの問題を排除する方法を説明します。これにより、コードの信頼性が向上し、開発コストを抑えられます。次に、サンプル・アプリケーションの使用方法を示します。
説明 PDF
Inspector: スレッドエラーを排除してプログラムの安定性を向上
このガイドでは、サンプル・アプリケーションを使って、インテル® Inspector の分析ツールにより、スレッドエラーの発生を未然に検出する方法を説明します。
説明 PDF
TATC: 入門ガイド (バージョン 2017)
インテル® Trace Analyzer & Collector 2017 の主要機能や各ホスト OS (Windows®/Linux*/macOS*) で製品を使い始めるにあたって必要な基本ステップをご紹介しています。
説明 WEB
TATC: MPI Perfomance Snapshot で MPI アプリケーションを解析する
パフォーマンス上の問題解析、問題特定、解決までをステップごとに解説します。
  • アプリケーションのパフォーマンスの問題を特定
  • 通信ホットスポットを特定
  • アプリケーションのレビュー
説明 PDF
TATC: MPI アプリケーションの解析
このチュートリアルでは、サンプルプログラムに適用される以下のワークフローを説明します。アプリケーションにも同じワークフローを適用することができます。
  • インテル® Trace Analyzer のチャートからアプリケーション内の通信のインバランスを検出します。
  • インテル® VTune™ Amplifier XE を使用して、アプリケーションのプロセス内のホットスポットを検出します。
  • アプリケーションのレビュー
説明 PDF
TATC: ハイブリッド・アプリケーションのチューニング (Parallel Universe 24号)

インテル® Parallel Studio XE Cluster Edition のコンポーネントであるインテル® VTune™ Amplifier XE とインテル® Trace Analyzer & Collector の機能を利用して、MPI + OpenMP* アプリケーションをチューニングします。

  • 本記事は、並列化マガジン Parallel Universe 24 号の記事の 1 つです
説明 PDF
MPI: インテル® MPI のメモリー消費 (Parallel Universe 21号)

メモリー消費の解析は複雑です。この記事では、インテル® MPI ライブラリーのメモリー消費を推定し、ライブラリーの設定を微調整してメモリー・フットプリントを減らす方法を説明します。

  • 本記事は、並列化マガジン Parallel Universe 21 号の記事の 1 つです
説明 PDF
VTune: インテル® VTune™ Amplifier XE 2017 マイクロアーキテクチャーのトップダウン解析法を 使用して、アプリケーションをチューニングする

アプリケーションが CPU マイクロアーキテクチャーの利点を活用するには、アプリケーションが利用可能なハードウェア・リソースをどのように使用しているか知る必要があります。
本資料では、インテル ® VTune™ Amplifier XE のマイクロアーキテクチャーのトップダウン解析法を使用して、アプリケーションをチューニングする方法をご紹介しています。

説明 PDF
VTune: インテル® VTune™ Amplifier XE 2017 General Exploration (一般解析) がどのように動作するかを理解する

インテル® VTune™ Amplifier XE の General Exploration (一般解析) タイプは、アプリケーションやシステムのマイクロアーキテクチャーに関連するハードウェアのボトルネックを検出する際に使用します。一般解析は、ハードウェア・イベント・カウンターを使用して問題の検出と場所の特定を行い、利用者が見やすく対処しやすい形式でデータを表示します。
本資料では、この解析で使用されるメカニズムを説明し、結果の解釈方法、およびこの解析を行う際の複雑性と問題を示していきます。

説明 PDF
インテル® Xeon® プロセッサーとインテル® Xeon Phi™ プロセッサーにおけるディープラーニング訓練と推論 パフォーマンスの向上
このホワイトペーパーでは、フレームワークのコードを変更することなく、インテル® Xeon® プロセッサーおよびインテル® Xeon Phi™ プロセッサー上でオープンソースの TensorFlow* と Caffe のディープラーニング訓練/推論のパフォーマンスを (最大 2 倍/最大 2.7 倍) 向上する方法を紹介します。システムレベルの最適化により、画像認識畳み込みニューラル・ネットワーク (CNN) ワークロードのスループットの向上と訓練時間の削減を実現します。
説明 PDF
インテル® Xeon Phi™ コプロセッサー開発者向け特集ページ
インテル® Xeon Phi™ コプロセッサー関連のドキュメント、サンプルコード、導入事例をまとめています。
説明 WEB
インテル® Xeon Phi™ 製品ファミリーでのインテル® MPI ライブラリーの使用ガイド
メッセージ・パッシング・インターフェイス (MPI) 標準は、分散メモリー並列プログラミングで使用されるルーチン群で構成されるメッセージ・パッシング・ライブラリーです。このガイドは、インテル® Xeon Phi™ プロセッサー/コプロセッサーを含む開発プラットフォーム上で、インテル® MPI ライブラリーを使用してコードを記述し、MPI アプリケーションを実行するのを支援することを目的としています。
説明 / WEB
iSUS オンライン・トレーニング (Code Modernization)

Code Modernization 最適化フレームワークは、アプリケーションのパフォーマンスを向上するため体系的なアプローチをとります。このフレームワークは、5 つの最適化ステージを通して、反復的にアプリケーションのパフォーマンスを改善します。Code Modernization については、こちらの記事もご参照ください。

このシリーズは、インテル® Xeon Phi™ コプロセッサーに取り組む開発者向けに、Code Modernization に役立つ情報を提供します。

説明 WEB
iSUS 関連ページ (インテル® Xeon Phi™ コプロセッサー)
米インテル社の Intel® Xeon Phi™ Coprocessor (英語) の参考訳をもとにしたページです。
説明 WEB
iSUS 関連記事一覧 (Xeon、Xeon Phi)
説明

ツールスイート製品の紹介動画や製品の利用方法を解説するビデオを公開中。

製品セミナーや関連イベントをご紹介。

評価版申込み

製品の無料評価版申込みはこちらから。

購入

技術情報

サポート