インテル® MKL 2018 リリースノート

本ページは、2017 年 9 月 7 日時点のインテル® MKL 2018 リリースノートの日本語訳です。 最新のリリースノートについては、Intel 社のウェブサイト (英語) をご覧ください。

このドキュメントには、インテル® マス・カーネル・ライブラリー (インテル® MKL) ソフトウェア製品の新機能と注意事項についての概要が含まれています。
インテル® MKL に関する最新情報は、次のリンクを参照してください。

ドキュメント、ヘルプ、サンプルコードのリンクは、技術ポータル iSUS のインテル® MKL ページに含まれています。テクニカルサポートについては、インテル® MKL: テクニカル・サポート・フォーラム (英語) を参照するか、インテル® MKL ナレッジベース (英語) の記事を参照してください。

メールアドレスとともに製品を登録してください。これは、インテルがサポートフォーラムにおいてお客様を認識するのに役立ちます。また、製品のアップデートの通知にも利用されます。ソフトウェア製品の登録に電子メールアドレスを使用することに関して不明な点がある場合は、インテルのプライバシー通知をお読みください。

製品の内容
インテル® MKL は、インテル® Parallel Studio XE 2018 Composer/Professional/Cluster Edition 製品の一部としてインストールされます。
インテル® MKL は、IA-32 アーキテクチャーとインテル® 64 アーキテクチャーの両方に対応した 1 つのパッケージおよびオンライン・インストーラーで構成されます。

  • BLAS 機能:
    • コンパクトな形式で行列のグループを処理するコンパクトな GEMM 関数 (mkl_{s,d,c,z}gemm_compact) と TRSM 関数 (mkl_{s,d,c,z}trsm_compact) および新しい形式をサポートするサービス関数を追加。
    • すべてのアーキテクチャーで量子化行列向けに最適化された整数行列-行列乗算ルーチン GEMM_S8U8S32 および GEMM_S16S16S32 を追加。

  • BLAS 最適化:
    • AVX512_4FMAPS と AVX512_4VNNIW 命令をサポートしているインテル® アドバンスト・ベクトル・エクステンション 512 (インテル® AVX-512) 対応インテル® Xeon Phi™ プロセッサー向けに SGEMM と SGEMM を最適化。
    • インテル® AVX2、インテル® AVX-512 およびインテルAVX512_4FMAPS と AVX512_4VNNIW 命令をサポートしているインテル® AVX-512 対応インテル® Xeon Phi™ プロセッサー向けに GEMM_S8U8S32 と GEMM_S16S16S32 を最適化。

  • ディープ・ニューラル・ネットワーク:
    • 非正方プーリングカーネルのサポートを追加。
    • インテル® Xeon Phi™ プロセッサーにおける大規模な非正方カーネルのパフォーマンスを向上。
    • 平面 (nchw、nhwc) と内部データレイアウト間の変換を最適化。

  • LAPACK:
    • 小行列 (N<16) に次の拡張と最適化を追加:
      • 直接呼び出し機能をコレスキーおよび QR 分解で拡張してパフォーマンスを大幅に向上
      • パフォーマンスを大幅に向上させるピボット選択なし LU/Inverse ルーチンを追加: mkl_?getrfnp および mkl_?getrinp
      • パックされた複数の行列をより高速に解くためコンパクトルーチンを追加: mkl_?getr[f|i]np_compact、mkl_?potrf_compact および mkl_?geqrf_compact
    • 縦長/横長行列向けに ?gesvd、?geqr/?gemqr、?gelq/?gemlq ルーチンに最適化を追加
    • ?pbtrs ルーチンに最適化を追加
    • インテル® スレッディング・ビルディング・ブロック (インテル® TBB) レイヤー向けに ?potrf ルーチンに最適化を追加
    • コレスキー分解ルーチンに最適化を追加: ?dorcsd および ?orcsd2by1
    • オーセンのアルゴリズムに基づく因数分解とソルバールーチンを追加: ?sytrf_aa/?hetrf_aa、?sytrs_aa/?hetrs_aa
    • 制限付き Bunch-Kaufman (rook) 枢軸選択アルゴリズムを利用した対称不定 (エルミート不定) 因数分解向けの新しい (faster)_rk ルーチンを追加

  • ScaLAPACK:
    • JOBZ=’N’ (固有値のみ) のケース向けに最適化 (2 段階のバンド・リダクション) を追加

  • FFT:
    • FFT ドメインで verbose をサポート (ユーザーはインテル® MKL 向けの FFT 記述子情報をキャプチャーできます)
    • インテル® AVX-512 命令対応インテル® Xeon® プロセッサー (開発コード名 Skylake Server) およびインテル® Xeon Phi™ プロセッサー 72xx (開発コード名 Knights Landing) 向けに 2D 実数-複素数および複素数-実数のパフォーマンスを向上
    • インテル® AVX-512 命令対応インテル® Xeon® プロセッサー (開発コード名 Skylake Server) およびインテル® Xeon Phi™ プロセッサー 72xx (開発コード名 Knights Landing) 向けに 3D 複素数-複素数のパフォーマンスを向上

  • インテル® Optimized High Performance Conjugate Gradient Benchmark:
    • インテル® MKL API を利用したベンチマークの新しいバージョン

  • スパース BLAS:
    • 前処理付き対称ガウス・ザイデルを追加
    • 生成された配列および初期配列の ddot 計算を含む前処理付き対称ガウス・ザイデルを追加
    • 生成された配列および初期配列の ddot 計算を含むスパース Matvec ルーチン
    • OpenMP* とインテル® TBB の両方をサポートするスパース Syrk ルーチン
    • インテル® AVX-512 命令セットでスパース MM および MV 機能のパフォーマンスを向上

  • クラスター用直接法スパースソルバー:
    • 転置ソルバーのサポートを追加

  • ベクトルマス:
    • 24 の新しい関数を追加: v?Fmod、v?Remainder、v?Powr、v?Exp2、v?Exp10、v?Log2、v?Logb、v?Cospi、v?Sinpi、v?Tanpi、v?Acospi、v?Asinpi、v?Atanpi、v?Atan2pi、v?Cosd、v?Sind、v?Tand、v?CopySign、v?NextAfter、v?Fdim、v?Fmax、v?Fmin、v?MaxMag および v?MinMag (インテル® AVX-512 対応プロセッサー向けの最適化を含む)

  • データ・フィッティング:
    • 3 次スプラインベースの補間をインテル® AVX-512 命令対応インテル® Xeon® プロセッサー (開発コード名 Skylake Server) で最大 8 倍、インテル® Xeon Phi™ プロセッサー 72xx (開発コード名 Knights Landing) で最大 2.5 倍最適化

  • ドキュメント:
    • このバージョンから、インテル® MKL のドキュメントの多くはオンライン (https://software.intel.com/en-us/articles/intel-math-kernel-library-documentation) (英語) のみで提供されるようになりました。また、インテル® ソフトウェア開発製品レジストレーション・センターから、日本語ドキュメントを含むドキュメントをダウンロードすることもできます: Product List > Intel® Parallel Studio XE Documentation。
  • インテルは、ユーザーの課題に最適なソリューションを提供するため、インテル製品の市場を継続的に評価しています。この評価プロセスの一環として、インテルはインテル® Xeon Phi™ コプロセッサー 7200 (開発コード名 Knights Landing) を市場に投入しないことを決定しました。
    • インテル® Xeon Phi™ 7200 プロセッサーの迅速な採用状況を考慮し、インテルは一般市場に Knights Landing (開発コード名) コプロセッサーを展開しないことを決めました。
    • インテル® Xeon Phi™ プロセッサーは、引き続きインテルのソリューション・ポートフォリオの主要要素として、ユーザーに最も魅力的で競争力のあるソリューションを提供します。

  • インテル® Xeon Phi x100 製品ファミリー (開発コード名 Knights Corner) のサポートは、このリリースで終了しました。インテル® Xeon Phi™ x100 製品ファミリー (開発コード名 Knights Corner) は、2017 年 1 月に終息したため、インテル® Parallel Studio XE 2017 でのみサポートされます。インテル® Xeon Phi™ x100 製品ファミリーに対するインテル® Parallel Studio XE 2017 のサポートは、製品終息から 3 年後の 2020 年 1 月に終了します。有効なサポートサービスをお持ちの方にサポートが提供されます。
  • インテル® AVX-512 で入力の空間次元がカーネルの空間次元よりも小さい場合、フォワードパスの畳み込みプリミティブが正しくない結果を返したりクラッシュすることがあります。
  • インテル® MKL FFT – 出力を転置する複素数-複素数インプレース・バッチ 1D FFT は正しくない結果を返します。
  • 既知の OpenMPI* の問題 (https://github.com/open-mpi/ompi/issues/3937) (英語) により、OpenMPI* 1.6.1 以降とともにインテルの ScaLAPACK を使用するとエラーになることがあります。回避策は、OpenMPI* を使用しないことです。
  • ML_ERRMODE_EXCEPT が設定されていない場合 (デフォルト) でも、インテルの VML 関数で FP 例外が誤って発生することがあります。推奨: VML 関数を呼び出す前に FP 例外をマスク解除しないでください。
  • アプリケーションがインテル® TBB スレッドレイヤーを組み合わせたシングル・ダイナミック・ライブラリー (SDL) インターフェイスでベクトルマス関数を使用した場合、次のランタイムエラーが発生することがあります: “Intel MKL FATAL ERROR: Error on loading function mkl_vml_serv_threader_c_1i_2o.”

テクニカルサポート
インストール時に製品の登録を行わなかった場合は、インテル® ソフトウェア開発製品レジストレーション・センターで登録してください。登録を行うことで、テクニカルサポートが利用できるようになります。また、サポートサービスが有効な間、製品のアップデートおよびアップグレードを無償で利用することができます。
テクニカルサポート、製品のアップデート、ユーザーフォーラム、FAQ、ヒント、およびその他のサポート情報は、http://www.intel.com/software/products/support/ (英語) を参照してください。
: 販売代理店がこの製品のテクニカルサポートを提供している場合は、インテルではなく販売代理店にお問い合わせください。
FAQ、ヒントとトリック、その他のサポート情報を含む、インテル® MKL についての技術情報は、インテル® MKL フォーラム http://software.intel.com/en-us/forums/intel-math-kernel-library/ (英語) およびインテル® MKL ナレッジベース http://software.intel.com/en-us/articles/intel-mkl-kb/all/ (英語) を参照してください。

インストール時に製品の登録を行わなかった場合は、インテル® ソフトウェア開発製品レジストレーション・センターで登録してください。登録を行うことで、サポートサービス期間中 (通常は 1 年間)、製品アップデートと新しいバージョンの入手を含む無償テクニカルサポートが提供されます。
テクニカルサポート、製品のアップデート、ユーザーフォーラム、FAQ、ヒント、およびその他のサポート情報は、https://software.intel.com/en-us/support (英語) を参照してください。

インテル® MKL の一部の基となった BLAS の原版は http://www.netlib.org/blas/index.html (英語) から入手できます。
インテル® MKL の一部の基となった LAPACK の原版は http://www.netlib.org/lapack/index.html (英語) から入手できます。LAPACK の開発は、E. Anderson、Z. Bai、C. Bischof、S. Blackford、J. Demmel、J. Dongarra、J. Du Croz、A. Greenbaum、S. Hammarling、A. McKenney、D. Sorensen らによって行われました。LAPACK の FORTRAN 90/95 インターフェイスは、LAPACK95 パッケージ http://www.netlib.org/lapack95/index.html (英語) のインターフェイスに似ています。すべてのインターフェイスは pure プロシージャー向けに提供されています。
インテル® MKL の一部の基となった ScaLAPACK の原版は http://www.netlib.org/scalapack/index.html (英語) から入手できます。ScaLAPACK の開発は、L. S. Blackford、J. Choi、A. Cleary、E. D'Azevedo、J. Demmel、I. Dhillon、J. Dongarra、S. Hammarling、G. Henry、A. Petitet、K. Stanley、D. Walker、R. C. Whaley らによって行われました。
拡張固有値ソルバーは、Feast Eigenvalue Solver 2.0 (http://www.ecs.umass.edu/~polizzi/feast/ (英語)) を基にしています。
インテル® MKL の PARDISO* (PARallel DIrect SOlver) の開発は、バーゼル大学のコンピューター・サイエンス学部 (http://www.unibas.ch (英語)) によって行われました。http://www.pardiso-project.org (英語) から入手できます。
本リリースのインテル® MKL の一部の FFT 関数は、カーネギーメロン大学からライセンスを受けて、SPIRAL ソフトウェア生成システム (http://www.spiral.net/) (英語)) によって生成されました。SPIRAL の開発は、Markus Püschel、José Moura、Jeremy Johnson、David Padua、Manuela Veloso、Bryan Singer、Jianxin Xiong、Franz Franchetti、Aca Gacic、Yevgen Voronenko、Kang Chen、Robert W. Johnson、Nick Rizzolo らによって行われました。

本資料は、明示されているか否かにかかわらず、また禁反言によるとよらずにかかわらず、いかなる知的財産権のライセンスも許諾するものではありません。
インテルは、明示されているか否かにかかわらず、いかなる保証もいたしません。ここにいう保証には、商品適格性、特定目的への適合性、知的財産権の非侵害性への保証、およびインテル製品の性能、取引、使用から生じるいかなる保証を含みますが、これらに限定されるものではありません。
本資料には、開発中の製品、サービスおよびプロセスについての情報が含まれています。本資料に含まれる情報は予告なく変更されることがあります。最新の予測、スケジュール、仕様、ロードマップについては、インテルの担当者までお問い合わせください。
本資料で説明されている製品およびサービスには、不具合が含まれている可能性があり、公表されている仕様とは異なる動作をする場合があります。現在確認済みのエラッタについては、インテルまでお問い合わせください。
Intel、インテル、Intel ロゴ、Xeon、Intel Xeon Phi は、アメリカ合衆国および / またはその他の国における Intel Corporation の商標です。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
© 2017 Intel Corporation.


コンパイラーの最適化に関する詳細は、最適化に関する注意事項を参照してください。