
数学、科学、金融向けに最適化された演算ルーチン
インテル® マス・カーネル・ライブラリー (インテル® MKL) は、工学、科学、金融系アプリケーションなど、極めて高いパフォーマンスが求められるアプリケーションに、高度に最適化されたスレッドセーフな演算ルーチンを提供します。 クラスター向けの ScaLAPACK (スケーラブル LAPACK) も標準の MKL 製品に含まれました (バージョン 10.0 より)。
特長
- インテル® プラットフォーム上で優れたパフォーマンスを発揮
インテル® Itanium® プロセッサー、インテル® Xeon® プロセッサー、インテル® Pentium® 4 プロセッサー、インテル® Core™2 Duo プロセッサーをベースとしたシステム用に最適化された演算ライブラリーを使用して、パフォーマンスを最大限に引き出します。また、他社製のプロセッサー上でも優れたパフォーマンスを発揮します。
インテル® MKL と ATLAS 3.8.3 の性能比較 ※
8 スレッドでは ATLAS 比で最大 20% の性能
- マルチコア対応
- マルチプロセッサー・システムで優れたスケーラビリティーを発揮
ビルドインの並列処理により、マルチプロセッサー上で優れたパフォーマンスを得ることができます。インテル® MKL のレベル 3 BLAS および高速フーリエ変換は、OpenMP を使用して高度にスレッド化されています。 - スレッドセーフ
インテル® MKL の関数はすべてスレッドセーフです。
マルチコア・プロセッサーで並列実行を実現
- 自動ランタイム・プロセッサー検出機能
各プロセッサー用に最適化されたコードが実行されるようにランタイムチェックが行われるため、実行しているシステムに関係なく、常に最適なパフォーマンスが提供されます。
- C および Fortran インターフェイスのサポート
- ロイヤルティー無料 (数量無制限)
※ベンチマーク設定情報
Versions: Intel® MKL 10.2 ATLAS 3.8.3
Hardware: Quad-Core Intel® Xeon® Processor W5580 3.2Ghz 8MB L2 cache 12GB Memory
OS: Fedora 10 x86_64
資料: Intel Corporation. 結果は、幾何平均に基づいて全体的な性能スコアをまとめたものです。性能に関するテストや評価は、特定のコンピューター・システム、コンポーネント、またはそれらを組み合わせて行ったものであり、このテストによるインテル製品の性能の概算の値を表しているものです。システム・ハードウェア、ソフトウェアの設計、構成などの違いにより、実際の性能は掲載された性能テストや評価とは異なる場合があります。システムやコンポーネントの購入を検討される場合は、ほかの情報も参考にして、パフォーマンスを総合的に評価することをお勧めします。インテル製品の性能評価についてさらに詳しい情報をお知りになりたい場合は、http://www.intel.co.jp/jp/performance/resources/benchmark_limitations.htm を参照してください。
インテル® マス・カーネル・ライブラリー 10.2 のポイント
インテル® マス・カーネル・ライブラリー (インテル® MKL) 10.2 は、アプリケーション開発やランタイムでの変更を強いることなく進化した IA プロセッサーによるスケーラブルで安定したパフォーマンスを実現します。特に次の 3 つの主要な目的に焦点をあてています。
バージョン 10.2 の新機能
バージョン 10.0 からの新機能 新しいクアッドコア インテル® Xeon® プロセッサー 5300 番台、インテル® Core™ i7 プロセッサー向けの最適化新しい「階層化」アーキテクチャー インテル® MKL のバージョン 10.0 では、製品を再設計し、複数の階層を提供して、ベースのインテル® MKL パッケージが多くのインターフェイス、コンパイラー、プロセッサーの構成を 1 つのパッケージでサポートできるようにしました。他社のライブラリー製品では、開発環境の特定の構成に応じて製品を見つけ、ダウンロードし、インストールし、テストしなければならないことがあります。この新しいインテル® MKL アーキテクチャーは、インテル® MKL のパフォーマンスを活用するための労力を最小限に抑えながら、多種多様な顧客のニーズに最大限対応できるよう設計されています。詳細は、インテル® MKL ユーザーズガイドの「インテル® MKL 並列処理の使用」を参照してください。 |
|||||||||||||
スレッド化層
|
|||||||||||||
|
インターフェイス層 この層は以下を有効にします。
|
|||||||||||||
計算層
|
|||||||||||||
|
|||||||||||||
PARDISO 直接法スパースソルバー |
|||||||||||||
|
|||||||||||||
|
|||||||||||||
スパース BLAS |
|||||||||||||
圧縮スパース行形式で格納された 2 つの疎行列の和と積を計算するルーチン |
|||||||||||||
異なるスパース行列形式を変換するルーチンが追加 |
|||||||||||||
スパースのゼロベースのインデックス |
|||||||||||||
単精度サポートの追加 |
|||||||||||||
レベル 3 スパース BLAS 三角ソルバーのスレッド化 |
|||||||||||||
|
|||||||||||||
LAPACK |
|||||||||||||
コールバック関数メカニズムを介した冗長な LAPACK 計算の追跡、中断機能が追加。mkl_progress という関数をユーザー・アプリケーションで定義して、MKL LAPACK ルーチンのサブセットから呼び出すことができます。この機能をサポートしている LAPACK 関数を確認するには、各関数の説明を参照してください。 |
|||||||||||||
|
|||||||||||||
離散フーリエ変換インターフェイス (DFTI) |
|||||||||||||
DftiCopyDescriptor 関数が FFT の使用時の便利性のために追加 |
|||||||||||||
DFTI を呼び出す、静的にリンクされた実行ファイルのサイズが大幅に減少 |
|||||||||||||
複素数格納が実数-実数変換用に利用可能 |
|||||||||||||
|
|||||||||||||
反復法ソルバーのプリコンディショナー |
|||||||||||||
インテル® MKL RCI 反復法ソルバーの ILUT アクセラレーター/プリコンディショナー |
|||||||||||||
|
|||||||||||||
ベクトル数学関数 |
|||||||||||||
新しい Mul 関数、Conj 関数、MulbyConj 関数、CIS 関数、Abs 関数 |
|||||||||||||
新しい強化されたパフォーマンス (EP) モード EP モードは、数学関数の不確かさがパラメーターの不確かさを決定付けないアプリケーション向けです (例: モンテカルロ・シミュレーションやメディア・アプリケーション) |
|||||||||||||
すべての VML 関数がスレッド化 |
|||||||||||||
最適化されたバージョンの正規累積分布関数 (CdfNorm)、逆関数 (CdfNormInv)、逆エラー補完関数 (ErfcInv) がベクトル・マス・ライブラリーに追加 |
|||||||||||||
|
|||||||||||||
ユーザーズガイド |
|||||||||||||
インテル® MKL ユーザーズガイドが大幅に向上。インテル® MKL での作業に欠かせないガイドです。ドキュメント ・ページでダウンロードまたはオンライン表示が可能です。 |
|||||||||||||
ライブラリーのあらゆる分野でパフォーマンスの最適化が行われています。次に測定されたパフォーマンス・ゲインをいくつか示します。「パフォーマンスの向上」ページでは、(インテル® MKL の以前のバージョンを含む) 測定されたパフォーマンス向上のリストが掲載されています。パフォーマンスについての詳細は、各製品のドメインページ (BLAS/LAPACK、FFT、VML など) をご覧ください。 BLAS |
|||||||
|
|||||||
|
|||||||
VML |
|||||||
|
|||||||
その他 |
|||||||
|
|||||||
![]() |
インテル® MKL と ATLAS 3.8.3 の性能比較 ※ 8 スレッドでは ATLAS 比で最大 20% の性能 |
※ベンチマーク設定情報
Versions: Intel® MKL 10.2 ATLAS 3.8.3
Hardware: Quad-Core Intel® Xeon® Processor W5580 3.2Ghz 8MB L2 cache 12GB Memory
OS: Fedora 10 x86_64
資料: Intel Corporation. 結果は、幾何平均に基づいて全体的な性能スコアをまとめたものです。性能に関するテストや評価は、特定のコンピューター・システム、コンポーネント、またはそれらを組み合わせて行ったものであり、このテストによるインテル製品の性能の概算の値を表しているものです。システム・ハードウェア、ソフトウェアの設計、構成などの違いにより、実際の性能は掲載された性能テストや評価とは異なる場合があります。システムやコンポーネントの購入を検討される場合は、ほかの情報も参考にして、パフォーマンスを総合的に評価することをお勧めします。インテル製品の性能評価についてさらに詳しい情報をお知りになりたい場合は、http://www.intel.co.jp/jp/performance/resources/benchmark_limitations.htm を参照してください。
| インテル® プラットフォーム上で優れたパフォーマンスを発揮 インテル® Itanium® プロセッサー、インテル® Xeon® プロセッサー、インテル® Pentium® 4 プロセッサー、インテル® Core™2 Duo プロセッサーをベースとしたシステム用に最適化された演算ライブラリーを使用して、パフォーマンスを最大限に引き出します。新しいクアッドコア インテル® Xeon® プロセッサー 5300 番台、 インテル® Core™ i7 プロセッサー向けのマルチコア・スレッド・パフォーマンスの最適化に重点を置いています。また、他社製のプロセッサー上でも優れたパフォーマンスを発揮します。 |
||||||||||||||||
| マルチコア対応 | ||||||||||||||||
|
| 線形代数 - BLAS および LAPACK BLAS および LAPACK ルーチンは、インテル® プロセッサー用に最適化されており、従来のインプリメンテーションよりもパフォーマンスが大幅に向上します。インテル® MKL は、LAPACK の新規リリース 3.1 と互換性があります。 |
|
線形代数 - ScaLAPACK |
|
| 線形代数 - スパースソルバー PARDISO 直接法スパースソルバーは、大規模な線形連立方程式を解くためのソフトウェア・ライブラリーです。使いやすくスレッドセーフで、またハイパフォーマンスかつメモリー効率が高く、バーゼル大学 (University of Basel) からライセンスを許諾されています。インテル® MKL には、共役勾配反復法ソルバーおよび FGMRES 反復法ソルバーも含まれています。 |
|
| 分散メモリー・マルチプロセッサー (クラスター) 用高速フーリエ変換 クラスター・エディションでのみ利用できます。より多くのプロセッサーに作業を分散させることで、FFT パフォーマンスがより向上します。 |
|
| ベクトル・マス・ライブラリー ハイレベルな数学関数群 (累乗関数、三角関数、指数関数、双曲線関数、対数関数など) をベクトル化して実装することで、アプリケーションの速度を向上します。 |
|
| ベクトル乱数ジェネレーター スカラー乱数ジェネレーターよりも優れたパフォーマンスが得られるベクトル乱数ジェネレーターを使用することで、シミュレーションを高速化します。 |
|
| LINPACK ベンチマーク インテルでは、インテル® アーキテクチャー・ベース・システムで最高レベルのベンチマーク結果を得るのに役立つ無料の LINPACK ベンチマーク・パッケージを提供しています。 |
オペレーティング・システム Linux 系の OS には、Red Hat、Suse、Debian、Ubuntu、Asianux およびその他の Linux Standard Base 3.1 系が含まれます。 全リストは、動作環境を参照してください。 |
|||||||||||||||||||
| 開発環境 インテル® MKL は、Microsoft Visual Studio、Xcode、Eclipse、GNU コンパイラー・コレクション (GCC) などの一般的なツールや開発環境と統合して使用することができます。 |
|||||||||||||||||||
| プロセッサー インテル® MKL 10.2 は次のインテル® プロセッサー・ファミリーをサポートしています。 |
|||||||||||||||||||
|
|||||||||||||||||||
| Windows Compute Cluster Server* 2003 | |||
| Windows Server* 2008 | |||
| Windows HPC Server* 2008 |
| Microsoft* Visual C++* 2008 | |||
| PGI* Workstation Complete version 7.1.6 |
| メッセージ・パッシング・インターフェイス (MPI) サポート | ||
| Linux | ||
| MPICH version 1.2.x | www-unix.mcs.anl.gov/mpi/mpich/ | |
| MPICH2 version 1.0.x | www-unix.mcs.anl.gov/mpi/mpich/ | |
| Open MPI 1.2.x | www.open-mpi.org | |
| SGI MPT (IntelR 64/IA-64) | www.sgi.com/products/software/mpt | |
| インテル® MPI ライブラリー 2.0、3.0、3.1、3.2 | www.intel.com/go/mpi | |
| Windows | ||
| Microsoft (MS) MPI、 CCE あるいは HPC 2008 (IntelR 64) | www.microsoft.com/downloads | |
| MPICH-2 1.0.X for Windows | www-unix.mcs.anl.gov/mpi/mpich | |
| インテル® MPI ライブラリー 3.1、3.2.x (IA-32/IntelR 64) | www.intel.com/go/mpi | |
| ハードディスク空き容量 | ||||
| Linux | Windows | |||
| インテル® マス・カーネル・ライブラリー | 1.3GB (インストール時の一時ファイル用に 450MB) | 1.1GB (インストール時の一時ファイル用に 300MB) | ||
新着ドキュメント
バージョン 10.2
バージョン 10.1
- 10.1 Windows 版インストール ガイド
- 10.1 Windows 版 リリースノート
- 10.1 Windows 版 README
- 10.1 Linux 版インストール ガイド
- 10.1 Linux 版 リリースノート
- 10.1 Linux 版 README
その他のドキュメント、役立つ情報
- インテル マス・カーネル・ライブラリー Windows 版ユーザーズガイド

- インテル マス・カーネル・ライブラリー Linux 版ユーザーズガイド

- インテル マス・カーネル・ライブラリー製品カタログ

- バージョン 9.x から 10.x への移行手順

- インテル マス・カーネル・ライブラリー リンクラインアドバイザー
インテル MKL を使用する環境に基づいて、適切なリンク方法をアドバイスしてくれる便利なツールです。
10.0 以前のドキュメント
- インテル® MKL 9.0 日本語マニュアル
次の内容が含まれます。ぜひご活用ください。
- 第 1 章 概要
- 第 2 章: BLAS ルーチンとスパース BLAS ルーチン
- 第 3 章: LAPACK ルーチン: 線形方程式
- 第 4 章: LAPACK ルーチン: 最小二乗問題および固有値問題
- 第 5 章: LAPACK 補助ルーチンとユーティリティー・ルーチン
- 第 6 章: ScaLAPACK ルーチン
- 第 7 章: ScaLAPACK 補助ルーチンとユーティリティー・ルーチン
- 第 8 章: スパース・ソルバー・ ルーチン
- 第 9 章: ベクトル数学関数
- 第 10 章: 統計関数
- 第 11 章: フーリエ変換関数
- 第 12 章: 区間線形ソルバー
- 第 13 章: 偏微分方程式のサポート
|
Windows 版 Mac OS 版 |
Linux 版 |
リリース情報
- バージョン 10.2 リリース!
- インテル® コンパイラーにバンドル!
インテル MKL ライブラリーは インテル C++/Fortran コンパイラー・ プロフェッショナル・エディション に同梱されています。
※インテル MKL ライブラリーは単体製品としても提供されています。
- インテル® コンパイラーへのアップグレード
インテル MKL ライブラリーをお持ち場合、インテル C++/Fortran コンパイラー・プロフェッショナル・エディションの SSR (サポートサービス更新) をご購入いただくことで、サポートサービスを 1 年更新し、且つ、インテル C++/Fortran コンパイラー・プロフェッショナル・エディションへアップグレードできます。詳細は アップグレード FAQ をご覧ください。