インテル® Xeon Phi™ プロセッサー/コプロセッサー特集

関連記事、導入事例、ドキュメントおよびサンプルコードをご紹介します。

インテル® Xeon Phi™ プロセッサーの紹介

インテル® Xeon Phi™ プロセッサーは、強力な並列化およびベクトル化によって、最も要求の厳しいハイパフォーマンス・コンピューティング・アプリケーションに対応する起動可能なホスト・プロセッサーです。電力効率に優れた統合されたアーキテクチャーが、比較的電力を消費しているユニットにより高いコンピューティングを提供し、総保有コストを改善します。1 メモリーとファブリックの統合により、メモリーの壁を打ち破り、コストを削減し、最大の課題を迅速に解決できるよう支援します。

インテルの 14nm プロセス技術を採用したインテル® Xeon Phi™ プロセッサーは、最大 72 のアウトオブオーダー・コア、インテル® アドバンスト・ベクトル・エクステンション 512 命令、384GB DDR4 プラットフォーム・メモリー容量を備えた最大 16GB のオンパッケージ高帯域メモリーを提供します。この最新のアーキテクチャーはプロセッサー当たりわずか215W で、3 テラ FLOPS (1 秒当たりの浮動小数点演算命令実行回数) の倍精度演算性能を実現します。

比類ない価値をもたらす優れたパフォーマンス

インテル® Xeon Phi™ プロセッサーの統合されたアーキテクチャーにより、パフォーマンスは向上し、ボトルネックとシステムの煩雑さが軽減されることでコスト削減にもつながります。インテル® Xeon Phi™ プロセッサーは、最大 490 GB/s の持続的なメモリー帯域幅 (ディスクリート・メモリー・カードの追加は不要)、100 GB/s I/O (追加コストなし)、2 つのファブリック・アダプターに必要なパワーを提供します。

包括的なインテルのロードマップで支援されたインテル® Xeon Phi™ プロセッサーは、柔軟かつポータブルで、再利用可能なコードのオープン規格を使用することで、投資効果を最大化する未来のソリューションです。

インテル® Xeon® プロセッサーとインテル® Xeon Phi™ プロセッサー、どちらを選びますか?

インテル® Xeon® プロセッサーは、パラレル / シリアル・コンポーネントのワークロードで優れたパフォーマンスを達成しますが、高度な並列化およびベクトル化を必要とするアプリケーションには、インテル® Xeon Phi™ プロセッサーが最適です。最大限に改良されたアプリケーションでは、超広域ベクトル機能 (インテル® AVX-512) に 72 コアがフル活用されるでしょう。高並列アプリケーションが利用される分野:アニメーション、電力、金融、生命科学、製造、医療、公共部門、天気予報など。

最適化されたアプリケーションのリストは、アプリケーションの一覧をご覧ください。

統合された包括的なソリューション

インテル® Xeon Phi™ プロセッサーは、コンピューティング、メモリー / ストレージ、ファブリック、ソフトウェアの組み合わせによりシステムのボトルネックと煩雑さを軽減するインテル® スケーラブル・システム・フレームワーク (インテル® SSF) の重要な構成要素です。インテル® SSF は、高性能でバランスのとれた、効率性と信頼性に富んだ HPC システム開発のための総合的なソリューションです。

インテル® Xeon Phi™ プロセッサー (Knights Landing) 向け

Colfax 社 Webinar コース「インテル® Xeon Phi™ プロセッサー向けチューニング、ベクトル化」 日本語資料

インテル® Xeon Phi™ プロセッサー (Knights Landing) 上での計算アプリケーションのベクトル化や、 コンパイラー命令、データコンテナーの最適化、データ並列処理のための言語拡張など、ベクトル化の重要な機能やベクトル化によるパフォーマンスを高度にチューニングするためのツールが紹介された Colfax 社の Webinar コースの資料を日本語化しました。

コースの内容は下記の通りです。

パート1: マルチスレッドの手法

  • 同期を最小限に抑える
  • フォルス・シェアリングを回避する
  • 並列処理を行う
パート2: ベクトル化のチューニング
  • コンパイラーと開発者の役割
  • ディレクティブを利用したチューニング
  • データコンテナーの最適化 • 言語拡張
パート3: メモリー・トラフィックの制御
  • キャッシュ使用率の最大化
  • メモリー帯域幅の最適化
  • インテル® Xeon Phi™ プロセッサー: 高帯域メモリー

Colfax 社による最新情報は、こちらの Colfax 社 Web サイト (英語) をご覧ください。


説明 PDF
インテル - HPE アライアンス : HPC 分野で新たな改革が始まった

2015年 7月、インテルとヒューレット・パッカード エンタープライズ (HPE) は、HPC 分野におけるアライアンス強化を発表しました。インテルの最新テクノロジーとそれを採用した HPE サーバー製品も次々と登場しています。本資料では、インテルと日本ヒューレット・パッカードのキーパーソンによる対談をお届けします。

  • インテル® Xeon Phi™ プロセッサー Knights Landing についても一部紹介しております。
説明 PDF
開発者用 Knights Landing ガイド - 第 2 世代インテル® Xeon Phi™ プロセッサーの概要

本資料は、インテル® アーキテクチャーの現在と将来、 第 2 世代インテル® Xeon Phi™ プロセッサーの基本的な構造や概要、パフォーマンスを発揮するためのヒント(プログラミング、ベクトル化、最適化) などのトピックを紹介した Colfax 社の Web セミナー資料の日本語訳です。

説明 PDF
Parallel Universe Issue 20 - 次世代のインテル® Xeon Phi™ プロセッサー/ コプロセッサー、Knights Landing への道のり

高度にスケーラブルな次世代のインテル® Xeon Phi™ プロセッサー / コプロセッサー、Knights Landing (開発コード名) 向けにアプリケーションを準備しましょう。

説明 PDF

インテル® Xeon Phi™ コプロセッサー向け

インテル® Xeon® プロセッサーとインテル® Xeon Phi™ コプロセッサー向けプログラミングの概要

インテル・プラットフォームの強みと、どのようなワークロードで恩恵を受けられるかを説明したより包括的な記事

説明 PDF
インテル® MPSS ユーザーズガイド (Windows 向け)

インテルル® MPSS (メニーコア・プラットフォーム・ソフトウェア・スタック) は、インテル® Xeon Phi™ コプロセッサーを使用する上で必要となる、動作する OS イメージや、設定用のアプリケーションなどが纏められたソフトウェア・スタックです。

本資料では、インテルル® MPSS インストール後の各種設定方法、ブート手順、各種ユーティリティーなどをご紹介しています。

説明 PDF
インテル® Xeon Phi™ コプロセッサー開発者向けクイック・スタート・ガイド

インテル® メニー・インテグレーテッド・コア (インテル® MIC) アーキテクチャー・ベースのインテル® Xeon Phi™ コプロセッサーが装着されたシステム (ホスト) 向けアプリケーションを作成し実行する際に役立つ情報を説明しています。

説明 PDF
「インテル® Xeon Phi™ コプロセッサー Microsoft* Windows* ホスト向けクイック・スタート・ガイド」

インテル® メニー・インテグレーテッド・コア (インテル® MIC) アーキテクチャー・ベースのインテル® Xeon Phi™ コプロセッサーが装着された Microsoft* Windows* システム向けアプリケーションを作成し実行する際に役立つ情報を説明しています。

説明 PDF
基本的な N 体シミュレーションによるインテル® Xeon Phi™ コプロセッサーのテスト

Colfax International の社トレーニング資料です。

天体物理学と生物物理学のさまざまな計算アプリケーションの基礎となる、基本的な N 体シミュレーションを使って、インテル® Xeon Phi™ コプロセッサーへの移植と最適化について説明しています。

説明 PDF
ホモジニアス・コードを使用したヘテロジニアス・クラスタリング: コードの再構成が不要なインテル® Xeon Phi™ コプロセッサーによる MPI アプリケーションの高速化

Colfax International の社トレーニング資料です。

汎用プロセッサー、およびインテル® Xeon Phi™ コプロセッサーによる 2 種類の計算デバイスを使用して、ヘテロジニアス・クラスター環境で分散並列アプリケーションを実行するケースについて説明しています。

説明 PDF
インテル® Xeon® プロセッサーおよびインテル® Xeon Phi™ コプロセッサーで共通のコードを使用した正方行列のマルチスレッド転送

Colfax International の社トレーニング資料です。

並列のインプレース正方行列置換の効率良い C 言語実装について説明しています。

説明 PDF
インテル® Xeon Phi™ コプロセッサーを搭載したクラスターのギガビット・イーサネットおよび InfiniBand* 上のピア・ツー・ピア MPI 通信の構成とベンチマーク

Colfax International の社トレーニング資料です。

ギガビット・イーサネットおよび InfiniBand* インターコネクトで接続された、インテル® Xeon Phi™ コプロセッサーを搭載したクラスターの構成手順について説明しています。

説明 PDF
インテル® Xeon Phi™ コプロセッサー向けアプリケーションの最適化 プログラミング・コードブック

プログラマーにとって、コア数とベクトルの幅の増加によりもたらされる処理能力を最大限に活用することは大きな課題です。

このコードブックは、これらの能力を利用しパフォーマンスを向上する最適化手法とモデルを、サンプルコードと共にいくつか紹介します。インテル® ソフトウェア開発ツールを使用することで、インテル® Core™ プロセッサー、インテル® Xeon® プロセッサー、インテル® Xeon Phi™ コプロセッサー向けの開発において一貫したモデル、言語、ツール、および手法により、数コアからメニーコアまでアプリケーションをスケールさせることができます。

説明 PDF
インテル® Xeon Phi™ コプロセッサー命令セットアーキテクチャー・リファレンス・マニュアル (英語)
PDF

米インテル社による並列化マガジン 日本語版

インテル® アーキテクチャーにおける OpenCL* 投資の活用

デバイス間の移植性からインテル® Xeon Phi™ コプロセッサーまで、広範にわたって OpenCL* を利用する方法を紹介します。

  • 本記事は、並列化マガジン Parallel Universe 18 号の記事の 1 つです
説明 PDF
Tachyon レイトレーサー: インテル® Xeon Phi™ コプロセッサーへの移植

オープンソースのレイトレーサーであり、Spec MPI* スイートに含まれる Tachyon を、インテル® Xeon Phi™ コプロセッサーやインテル® Xeon® プロセッサーに移植する方法を説明します。

  • 本記事は、並列化マガジン Parallel Universe 17 号の記事の 1 つです
説明 PDF
インテル® Cluster Studio XE 2013 SP1 の 新機能

インテル® Cluster Studio XE 2013 SP1 の新機能の概要を説明します。この HPC ソフトウェア開発ツール・スイートには、分散型メモリープログラムのより高速かつ効率良い実行を支援する、最新のインテル® MPI ライブラリーおよびインテル® Trace Analyzer & Collector が含まれます。

インテル® MPI ライブラリーでは、すべての InfiniBand* ファブリックへのサポートが拡張されています。具体的には、DAPL プロバイダーを自動的に選択するプロセスが改善され、OFA のスケーラビリティーが向上し、インテル® Xeon Phi™ コプロセッサーを使用したときの TMI のサポートが追加され、Microsoft* Network Direct のサポートが追加されました。

  • 本記事は、並列化マガジン Parallel Universe 16 号の記事の 1 つです
説明 PDF
フルスロットル : OpenMP* 4.0

「マルチコアは広く普及している。」これは、アプリケーション開発者の状況と彼らが直面しているハードウェアの変革を正確に表しています。最初のデュアルコア CPU の登場以来、コアの数は増加の一途を辿っています。インテル® Xeon Phi™ コプロセッサーの登場は、我々をメニーコアの世界へと導きました。最大 61 コア、コアごとに 4 スレッドというハードウェアの能力を引き出すには、アプリケーションの並列化に新しい要件が課されます。

OpenMP* は、OpenMP* タスク、SIMD 命令、そしてアプリケーション・コード、サードパーティーのライブラリー、ハードウェアの効率良い組み合わをサポートする新しい機能により、飛躍的な進歩を遂げました。

  • 本記事は、並列化マガジン Parallel Universe 16 号の記事の 1 つです
説明 PDF
インテル® Parallel Studio XE のコプロセッサー・デバッグのサポート

インテル® Xeon Phi™ コプロセッサーで全体または一部を実行するネイティブ・アプリケーションとオフロードプログラム用のデバッグ・ソリューションを検証します。インテル® Parallel Studio XE のツールは、コマンドライン、Eclipse* および Visual Studio* で、プログラムの制御フローと変数に関する単一ソースレベル・ビューを提供します。

  • 本記事は、並列化マガジン Parallel Universe 15 号の記事の 1 つです
説明 PDF
ショックウェーブ ! CloverLeaf とインテル® Xeon Phi™ コプロセッサーの巡り合い

インテル® Xeon Phi™ コプロセッサー を最大限に活用するため、スタッガード・デカルト格子上で 2 次元の圧縮性オイラー方程式を解く小さな CloverLeaf ベンチマー クをベクトル化します。このベクトル化により、パフォーマンスは約 8 0% も向上しました。

  • 本記事は、並列化マガジン Parallel Universe 14 号の記事の 1 つです
説明 PDF
インテル® Xeon Phi™ コプロセッサーとインテル® MPI ライブラリーのプログラミング・モデル

インテル® MPI ライブラリー Linux* 版を利用して既存のハイパフォーマンス・コンピューティング (HPC) アプリケーションをインテル® Xeon Phi™ コプロセッサー搭載プラットフォームへ移植する方法を説明します。

  • 本記事は、並列化マガジン Parallel Universe 14 号の記事の 1 つです
説明 PDF
パラレルパワー : インテル® Xeon Phi™ コプロセッサー用ソフトウェアの最適化

インテル® Xeon® プロセッサー用に現在最適化されているアプリケーションをインテル® Xeon Phi™ コプロセッサー用に最適化する場合の手法について簡単に説明します。

  • 本記事は、並列化マガジン Parallel Universe 13 号の記事の 1 つです
説明 PDF
インテル® Xeon Phi™ コプロセッサーのパフォーマンスを解き放つ

任意のコンパイラーとともに使用でき、開発者がインテル® Xeon Phi™ コプロセッサーのパフォーマンスを引き出せるように支援する、インテル® MKL の自動オフロード (AO) モデルについて簡単に説明します。

  • 本記事は、並列化マガジン Parallel Universe 13 号の記事の 1 つです
説明 PDF
インテル® Xeon Phi™ コプロセッサーへのワークロードの適合性を評価する

インテル® Xeon Phi™ コプロセッサーへのワークロードの適合性を評価する記事

説明 WEB
インテル® Xeon Phi™ コプロセッサーをサポートするシステム

ハードウェア導入およびサポートに関する情報

説明 WEB
インテル® Xeon Phi™ コプロセッサー – アーキテクチャー

このホワイトペーパーは、2012 年 9 月の Hot Chips 24 で発表された、第 1 世代インテル® Xeon Phi™ コプロセッサー (開発コード名: Knights Corner) に関する George Chrysos のプレゼンテーションを文章にしたものです。この記事で紹介している測定結果は、インテル コーポレーションの開発ラボでプロトタイプのハードウェアとシステムを用いて測定された結果であり、製品版と若干異なることに注意してください。

説明 WEB
インテル® Xeon Phi™ コプロセッサー開発者向けリソースガイド

この記事は、インテル® Xeon Phi™ コプロセッサーを使用してソフトウェア開発を始めようとする技術者向けに関連するリソースをまとめています。

説明 WEB
インテル® Xeon Phi™ コプロセッサー

このページではインテル® Xeon Phi™ コプロセッサーのプログラミングに関する記事や参考資料へのリンクをまとめています。

説明 WEB
Xeon 関連記事一覧
WEB
Xeon Phi 関連記事一覧
WEB
システム管理者ガイド (英語)
WEB
概要 言語 レベル

Intel® SDK for OpenCL* Applications XE Samples


インテル® SDK for OpenCL* Applications - サンプルパッケージは、インテル® プロセッサー向け OpenCL* アプリケーション・コードサンプルです。このサンプルパッケージには次の 2 つのセットがあります。

  • ビジュアル・コンピューティング向けコードサンプル

    インテル® プロセッサー・グラフィックス内蔵のインテル® プロセッサー・ベースのモバイルシステム向けです。

  • 高度に並列化されたワークロードのコードサンプル

    インテル® Xeon® プロセッサーおよびインテル® Xeon Phi™ コプロセッサー・ベースのシステム向けです。

» 詳細はこちら
OpenCL 初級
中級

SHOC MD Lab Exercises


Linux* 向けのこの演習シリーズは、インテル® Xeon Phi™ コプロセッサーへのアプリケーションの移植および最適化の基本について理解するため、分子動力学 (MD) のレナード・ジョーンズ・ポテンシャルを用いて NBody ペアの計算を行う簡単な実装例を紹介します。

» 詳細はこちら
C/C++ 初級
中級

Beginning Slides Extracted Code


インテル® Xeon Phi™ コプロセッサービギナー向けワークショップのスライドから抽出したサンプルを含みます。

» 詳細はこちら
C++、Fortran 初級

Beginning Labs Fortran Version


インテル® Xeon Phi™ コプロセッサーのビギナー向け演習用サンプル - Fortran バージョン

» 詳細はこちら
Fortran 初級

Beginning Labs C Version


インテル® Xeon Phi™ コプロセッサーのビギナー向け演習用サンプル - C/C++ バージョン

» 詳細はこちら
C/C++ 初級

iXPTC 2013 Presentations


» 詳細はこちら
C/C++ 初級
中級

Intel® Xeon Phi™ Advanced Workshop Labs


インテル® MKL、インテル® MPI ライブラリー、デバッグ、メモリーの最適化、チューニング、およびベクトル化など、より高度な練習を含むサンプル

» 詳細はこちら
C++、Fortran 上級

The Importance of Vectorization for Intel® Many Integrated Core Architecture (Intel® MIC Architecture) (Fortran Example)


インテル® メニー・インテグレーテッド・コア アーキテクチャー (インテル® MIC アーキテクチャー) やインテル® Xeon Phi™ コプロセッサーを含むシステムの優れたパフォーマンスを得るには、アプリケーションは、16 ワイド SIMD レジスターだけでなく、多くのコアを活用する必要があります。

» 詳細はこちら
Fortran 上級

Many Faces of Parallelism


この演習には、インテル® Xeon Phi™ コプロセッサー上で、プログラムを並列化する際の多くの例 (Riemann Sums、SGEMM、Fibonacci、Qsort、Cholesky Decomposition、Algorithm、Mandelbrot Set) が含まれています。

» 詳細はこちら
C/C++ 上級
AWE 社はインテル® Xeon Phi™ コプロ セッサーを利用して HPC 研究アプリケーション・パフォーマンスを向上

AWE 社は、インテル® Xeon Phi™ コプロセッサーを利用することで、大幅なパフォーマンス向上を実現しました。インテル® ソフトウェア・ツールと標準化されたスケーラブルなメニーコア・アーキテクチ ャーを 、AWE 社の専門技術ならびに高度な HPC ソフトウェアと組み合わせることで、顧客が求める高い精度と信頼性を備えたフォワード・ス ケーリングなアプリケーションを得られました。

インテル® Xeon Phi™ コプロセッサーは、計算物理学の研究にかかるコストと時間の削減、新しいプラットフ ォームへの移植にかかる時間の短縮、そして最新のテクノロ ジーによる専門知識の強化という利点を AWE 社にもたらしました。

AWE 社はイギリスの核抑止力と国防の要として
世界有数の最先端の研究、設計、製造施設を有し、
卓越した科学技術において中心的役割を果たしています
説明 PDF
Altair 社はインテル® Xeon Phi™ コプロセッサーで複雑なシミュレーションとワークロード管理の高速化に成功 -最先端のソフトウェアとアーキテクチャーで製品エンジニアリングの改革を推進

Altair は、優れたパフォーマンスと新機能のサポートが重要な分野において顧客の競争力を高めるため、新しいインテル® Xeon Phi™ コプロセッサーをできるだけ早くテストして利用したいと考えていました。

「初めて RADIOSS* 陽解法コードをコプロセッサーに移植することができました。GPU に移植していたらもっと大変だったでしょう。インテル® Xeon Phi™ コプロセッサーだからこそ実現することができました。」

Altair 社
ハイパフォーマンス・ コンピューティング・ディレクター
Eric Lequiniou 氏
説明 PDF
インテル® C++ Composer XE により並列処理を用いたプログラム開発を効率化し、SD 映像から HD 映像へのリアルタイム変換を実現

(インテル® C++ Composer XE の) 自動ベクトル化の機能が効果的でした。通常ならインテル® Xeon® プロセッサーとインテル® Xeon Phi™ コプロセッサーごとに手作業で行うベクトル化を、すべてコンパイラーに任せることができます。

また、コンパイラーの最適化オプションを使うことで、キャッシュサイズなど細かなパラメーターを指定することなく最高のパフォーマンスを得ることができました。

プログラム・ソース・コードの共有化によって、性能チューニングやメンテナンスは1回で済み、作業効率を高めることができました。これは、プロセッサーごとにソースコードの書き換えが必要な GPGPU と比較して大きなアドバンテージです

日本電気株式会社
グリーンプラットフォーム研究所
主任 石坂 一久 氏
説明 PDF

購入

技術情報

サポート