英特尔® 适用于英特尔® 平台与技术的英特尔® 软件开发产品
英特尔® Math Kernel Library 10.0 Windows* 版、Linux* 版及 Mac OS* X 版
 概述

 功能  兼容性
 重要亮点

 此版本的新增功能 系统要求
 功能  性能改善 技术支持

概述
英特尔® Math Kernel Library(英特尔® MKL)10.0 Windows* 版、Linux* 版及 Mac OS* 版

英特尔® Math Kernel Library(英特尔® MKL)提供经过高度优化、高度线程化的数学例程,这些例程专为性能要求很高的科学、工程以及金融等领域的应用而设计。

“英特尔 MKL”既作为独立的产品提供,也随英特尔集群工具包英特尔® 编译器专业版一起提供。

产品简介 [PDF 635KB]

英特尔® Math Kernel Library Flash 演示

查看 下载

重要亮点
10.0 版现已推出!
请参阅下面的新增功能与性能改善列表。详细的性能图表在此提供。
现在支持 Debian 与 Ubuntu
单击此处查看受支持的操作系统、编译器及处理器的完整列表。

英特尔 MKL Web 研讨会
我们将于 12 月 11 日推出免费的在线 Web 研讨会“使用多线程数学库开发高性能计算应用”。敬请访问以了解如何使用“英特尔 MKL”的高级线程功能。

免费注册

返回顶部

功能

在英特尔® 处理器上具有出众的性能
使用针对基于英特尔® 安腾® 2、英特尔® 至强®、英特尔® 奔腾® 4 以及英特尔® 酷睿™2 双核处理器的系统进行过高度优化的数学函数库,实现出众的性能。还针对新的四内核英特尔® 至强® 处理器 5300 系列进行了多线程性能的优化。与非英特尔处理器上的其它数学软件包相比,“英特尔 MKL”的性能具有明显的竞争优势。

支持多核处理器

在多处理器上具有极佳的伸缩性1
利用“英特尔 MKL”内置的并行技术,在多处理器系统(包括最新的双内核与四内核系统)上自动获取极佳的伸缩性。“英特尔 MKL”的“级别 3 BLAS”、“快速傅立叶变换”及“矢量数学”均使用 OpenMP* 进行过线程化处理。

线程安全性
所有的“英特尔 MKL”函数都能确保线程安全。此外还提供非线程化的串行版“英特尔 MKL”。

运行时处理器自动检测
通过执行运行时检查,确保无论应用程序在什么系统上运行,都会执行针对特定处理器进行过优化的代码,从而获得最佳性能。

对 C 与 Fortran 接口的支持
与其它一些替代性的数学库要求购买多个产品才能获取 C 与 Fortran 接口不同,“英特尔 MKL”同时提供这两种接口。

在单个软件包中支持所有英特尔® 处理器
其它替代性的数学库要求购买多套产品,以分别支持英特尔安腾 2、英特尔至强以及奔腾 4 处理器。“英特尔 MKL”在一个经济实惠的软件包中包含了对“所有”这些处理器的支持。

免版税发行权
运行时函数库可以随软件无限量再发行。

用户论坛
在由英特尔工程师主持的英特尔 MKL 论坛上同其他人分享经验。

英特尔® 首要支持
购买每套“英特尔 MKL”,即获赠为期一年的世界一流的技术支持。在此期间,包括主要发行版在内的产品升级均可免费下载。如需有关详细信息,请访问英特尔注册中心

返回顶部

功能

线性代数 - BLAS 与 LAPACK
部署针对英特尔处理器进行过高度优化的 BLAS 与 LAPACK 例程,它们提供的性能改善非常显著,远远超出其它替代性版本。“英特尔 MKL 10.0”与新的 LAPACK 3.1 版保持兼容。

线性代数 - ScaLAPACK
“英特尔 MKL”所实现的 ScaLAPACK 可以提供的性能改善非常显著,远远超出标准的 NETLIB 实现。

线性代数 - 稀疏矩阵解算器
使用“PARDISO 直接稀疏矩阵解算器”解算大型、稀疏线性系统方程;此解算器是由巴塞尔大学 (University of Basel) 授权的软件库,具有使用方便、线程安全、性能优异、内存效率高等优点。“英特尔 MKL”还包含“共轭梯度”与 FGMRES 迭代稀疏矩阵解算器。

快速傅立叶变换 (FFT)
采用多维 FFT 例程(1 维到最多 7 维,支持混合基数),并提供一个易于使用的先进的 C/Fortran 接口。“英特尔 MKL”还提供一套模拟 FFTW 2.x 与 3.0 接口的 C 例程(“封装器”),便于目前的 FFTW 用户比较它与“英特尔 MKL”的性能。

快速傅立叶变换(用于分布式内存多处理器,即集群)
仅在“集群版”中提供。通过将工作分配给大量的处理器来进一步改善 FFT 性能。

矢量数学库
使用矢量版的计算密集型核心数学函数(乘方、三角、指数、双曲以及对数等),可以提高应用程序的速度。

矢量随机数生成器
我们的矢量随机数生成器带来的性能改善远远超过其它替代性的标量随机数生成器,使用它们可以提高模拟速度。

LINPACK 基准测试
英特尔提供免费的 LINPACK 基准测试软件包,帮助您在基于英特尔® 体系结构的系统上获取最好的基准测试结果。

返回顶部

此版本的新增功能

在此版本的“英特尔 Math Kernel Library”(英特尔 MKL)中,我们致力于三大目标。首先,也总是最为重要的目标是:为最新的英特尔处理器(四内核英特尔至强处理器 5300 系列以及与其紧密相关的双内核英特尔® 至强® 处理器 5100 系列)提供优化的多线程性能。其次,我们对“英特尔 MKL”进行了重新架构,使之具有一个新的“层次化”体系结构,以更好地支持用户的各种用法模型。最后,我们已将“英特尔 MKL”的标准版与集群版合并到一起,现在我们拥有了一套综合性的软件包。

针对新的四内核英特尔至强处理器 5300 系列的优化
如需有关详细信息,请参阅以下“10.0 版的性能改善”部分。

新的“层次化”体系结构
在“英特尔 MKL 10.0 版”中,我们对产品进行了重新架构以提供多个层次结构,这样“英特尔 MKL”基本软件包便可以在单个软件包中支持大量的接口、编译器及处理器配置。其它许多数学库供应商有一些特定的版本,它们必须根据开发环境的特定配置进行寻找、下载、安装及测试。这个新的“英特尔 MKL”体系结构旨在为我们多样化的用户需求提供最大程度的支持,同时让获取并利用“英特尔 MKL”优异性能的努力降至最低。如需有关详细信息,请参阅“英特尔 MKL”用户指南的“使用英特尔 MKL 并行化”部分。

线程层
“英特尔 MKL”的所有线程都已隔离到这一层。链接到这层与您的开发环境匹配的版本,便可以确保"英特尔 MKL”不会与应用程序中的线程技术发生不兼容的现象。

  • 完全兼容 Microsoft、GCC 以及英特尔编译器线程技术
    这一层有多个不同的版本,它们分别使用不同的编译器(英特尔、MSFT 及 GCC)编译而成;这使得无论整个应用程序使用的开发环境如何,“英特尔 MKL”都能完全兼容其使用的线程机制。
  • 英特尔 MKL 串行版
    线程层还有一个不含线程技术的版本。这确保只要选择不在“英特尔 MKL”内使用线程技术,“英特尔 MKL”便不会同您的应用程序有任何形式的冲突。
接口层
这一层支持:
  • LP64 与 ILP64 接口
    “英特尔 MKL”基本软件包(不再提供单独下载)中现在包含 ILP64(64 位整数数据)接口。在新的层次化型中,已经努力在实现此接口的同时尽量减少了产品包大小的增加。
  • 不同的层来处理不同的编译器参数返回值机制(英特尔、GCC 及 MSFT)
  • Cray 风格的命名规范
计算层
  • “英特尔 MKL”的核心。它执行运行时检查,确保执行的是针对特定处理器进行过优化的代码。如果这一层的大小是个问题,则用户可以构建自定义的共享对象,以便只包含所需的特定代码,从而减少这一层的大小。

PARDISO 直接稀疏矩阵解算器

新增了对实对称矩阵的核外内存支持

稀疏 BLAS

稀疏矩阵零基索引

新增单精度支持

级别 3 稀疏矩阵 BLAS 三角解算器进行了线程处理

迭代解算器预处理器

“英特尔 MKL”RCI 迭代解算器的 ILUT 加速器/预处理器

矢量数学函数

新的 Mul、Conj、MulbyConj、CIS 及 Abs 函数。

新的"增强性能”模式
EP 模式适用于数学函数不准确性不会导致参数不准确性的应用程序(例如,蒙特卡洛模拟与多媒体应用)

所有 VML 函数现在都进行了线程处理

用户指南

我们已经对“英特尔 MKL 用户指南”进行了大幅改善。它是使用“英特尔 MKL”不可或缺的工具。请访问文档页面以下载或在线查看。

返回顶部

10.0 版中的性能改善

此函数库的所有方面都进行了性能优化。下面是一些测得的特定性能增益数据。

BLAS

对于中小问题,DGEMM 的线程化有所改善 - 外积大小改善 10%,平方大小改善 80%

DTRSM、DTRMM 及 DSYRK 改善达 5-30%

LAPACK

由于 LAPACK 3.1 基础上所作的改进,非对称特征值问题有了重大改善

缓存上 *HETRD 的改善达 75%

缓存上 *SYTRD 的改善达 40%

在 *HERDB/*SYRDB 中成功实现了“带宽缩减方法”,在双内核英特尔至强 5100 系列服务器上,同传统的 *HERDB/*SYRDB 相比,速度提升 2.8 倍

CROT/ZROT 性能改善达 80%

三对角线性方程解算器 (DGTSV/SGTSV) 的性能改善 8-10%

三对角对称正定线性方程解算器 (*PTSV) 的性能改善 8-28%

广义非对称特征值问题 (*GGEV) 的性能改善 3-8%,CGGEV 的性能改善达 30%

上三角 real*8 Cholesky 分解进行了线程化处理

(D/S/Z/C)STEDC 的性能改善达 30%;使用 OpenMP 并行化之后,在 4 个线程上的性能改善达 100%

测得的改善(包括旧版“英特尔 MKL”的)的完整列表在此提供。

每个产品领域页面(BLAS、FFT 及 VML 等)与性能摘要页面中均显示有综合性能图表。

返回顶部

兼容性

操作系统
“英特尔 MKL 10.0”支持 Linux*、Windows* 及 Mac OS* X。

Linux 变体包括:Red Hat*、Suse*、Debian*、Ubuntu*、Asianux* 以及其它各种 Linux Standard Base 3.1 变体。

如需完整的列表,请参阅系统要求

开发环境
“英特尔 MKL”非常易于使用,并且可以集成到主流的开发工具与环境,如 Microsoft Visual Studio*、Xcode*、Eclipse*、“GNU 编译器集”(GCC)。
处理器
“英特尔 MKL 10.0”支持以下英特尔处理器系列:
 

英特尔® 安腾处理器系列

英特尔® 至强® 处理器系列

英特尔® 酷睿™ 处理器系列

英特尔® 奔腾® 处理器系列

AMD Opteron* 与 Athlon* 处理器系列

如需完整的列表,请参阅下面的系统要求

返回顶部

系统要求

系统要求概述
处理器
Linux* 与 Windows*
Mac OS* X
操作系统
Linux
Windows
Mac OS X
编译器
Linux
Windows
Mac OS X
硬盘空间
返回顶部

处理器
支持的处理器
处理器 最低 建议 支持
英特尔® 安腾® 处理器系列   是 是
英特尔® 至强® 处理器系列   是 是
英特尔® 酷睿™ 处理器系列   是 是
英特尔® 奔腾® 4 处理器系列     是
英特尔® 奔腾® III 处理器     是
英特尔® 奔腾® 处理器(300 MHz 或更高主频) 是   是
英特尔® 赛扬® 处理器     是
AMD Athlon* 处理器     是
AMD Opteron* 处理器
  是
返回顶部

处理器
受支持的 Mac OS* X 处理器
(不适用于“英特尔® 数学核心函数库集群版”)
处理器 最低 建议 支持
英特尔® 酷睿™ 双核处理器 是 是 是
返回顶部

操作系统
支持的 Linux* 操作系统
Linux 操作系统 英特尔® 至强®、英特尔® 酷睿™2 双核、英特尔® 奔腾® 4 32 位处理器 支持 Intel® 64 体系结构的处理器 安腾® 2 处理器
Red Hat Enterprise Linux 3.0、4.0、5.0 版 是 是 是
Red Hat Fedora Core 5、6、7 版 是 是  
SUSE Linux Enterprise Server 9.0、10.0 版 是 是 是
SGI Propack 4.0、5.0 版 是 是 是
Debian 3.1、4.0(新!) 是 是 是
Ubuntu 6.0、7.0(新!) 是 是 是
Asianux 3.0
(Red Flag、Hansoft 及 Miracle)
是 是 是
Mandriva/Mandrake 10.1 是 是  
Turbo Linux 10、11 是 是 是
Linux Standard Base 3.1 是
是 是
返回顶部

操作系统
支持的 Windows* 操作系统
Windows 操作系统 英特尔® 至强®、英特尔® 酷睿™2 双核、英特尔® 奔腾® 4 32 位处理器 支持 Intel® 64 体系结构的处理器 安腾® 2 处理器
Windows Vista™ 是 是  
Windows XP 是    
Windows XP Pro 64-bit Edition   是  
Windows Server* 2003 是    
Windows Server 2003, Enterprise X64 Edition   是  
Windows Server 2003, 64-bit edition
  是
返回顶部

操作系统
支持的 Mac 操作系统
Mac OS* X 10.4.4 或更高版本
返回顶部

编译器
支持的 Linux* 编译器
(以下列表中的产品经过完全验证,但确实也可以同其它的编译器配合使用)
Linux 编译器 英特尔® 至强®、英特尔® 酷睿™2 双核、英特尔® 奔腾® 4 32 位处理器 支持 Intel® 64 体系结构的处理器 安腾® 2 处理器
英特尔® Visual Fortran 编译器 9.1、10.0 及 10.1 Linux 版 是 是 是
英特尔® C++ 编译器 9.1、10.0 及 10.1 Linux 版 是 是 是
GNU 编译器集* 是
是 是
返回顶部

编译器
支持的 Windows* 编译器
Windows 编译器 英特尔® 至强®、英特尔® 酷睿™2 双核、英特尔® 奔腾® 4 32 位处理器 支持 Intel® 64 体系结构的处理器 安腾® 2 处理器
英特尔® Visual Fortran 编译器 9.1、10.0 及 10.1 Windows* 版 是 是 是
英特尔® C++ 编译器 9.1、10.0 及 10.1 Windows 版 是 是 是
Microsoft Visual C++* 2005 是
是  
返回顶部

编译器
支持的 Mac OS* X 编译器
编译器
英特尔® Fortran 编译器 9.1、10.0 及 10.1 Mac OS X 版
英特尔® C++ 编译器 9.1、10.0 及 10.1 Mac OS X 版
GNU 编译器集*
* Apple Xcode* 2.0 所含的 Apple 版 GCC 4.0 也包括在内。
返回顶部

“消息传递接口”(MPI) 支持
Linux*
MPICH 1.2.5 www.topspin.com
MPICH 1.2.5.2 www-unix.mcs.anl.gov/mpi/mpich/
MPICH 1.2.5.10 www.myri.com
MPICH 2.0 www-unix.mcs.anl.gov/mpi/mpich/
Open MPI 1.1.2 www.open-mpi.org
SGI MPT www.sgi.com/products/software/mpt
英特尔® MPI 库 2.0、3.0 www.intel.com/go/mpi
Windows*
Microsoft MPI (MS MPI) www.microsoft.com
MPICH-2 1.0.X Windows 版 www-unix.mcs.anl.gov/mpi/mpich2
返回顶部
硬盘空间
  Linux* Windows* Mac OS* X
英特尔® Math Kernel Library 700 MB 600 MB 600 MB
返回顶部

技术支持

购买每套“英特尔® 软件开发产品”,即获赠为期一年的技术支持服务;在此期间您可以获取英特尔首要支持及所有的产品更新。“英特尔首要支持”给您提供在线访问技术说明、应用说明以及文档资料等项服务。安装产品后请进行注册,以获取技术支持及产品更新信息。

返回顶部

1 性能测试与评级均使用特定计算机系统与/或组件测量,其结果可以恰定地反映英特尔产品的大致性能。系统设计或配置上如有任何差异,均可能影响实际性能。顾客应参考其它信息来源,以全面评估考虑购买的系统或组件的性能。获取关于性能测试与英特尔产品性能的详细信息

英特尔同时提供工具与技术支持,以帮助改善应用软件的性能、功能及效率。

“英特尔® 软件开发产品”与主流的 Windows* 和 Linux* 开发环境兼容,是最能充分利用英特尔处理器最新功能的终南捷径。“英特尔软件开发产品”专为整个开发周期设计,其中包括“英特尔® 性能程序库”、“英特尔编译器”(C++ 与 Fortran 的 Windows 版、Linux 版及 Mac OS* X 版)、“英特尔® VTune™ 分析器”、“英特尔® 线程处理工具”以及“英特尔® 集群工具”。
“英特尔® 首要客户支持”网站为所有的英特尔软件产品提供专家技术支持,并提供产品更新及相关下载。如需了解详细产品信息,请访问:www.intel.com/software/products
英特尔、英特尔徽标、安腾、奔腾、英特尔迅驰、英特尔至强、Intel XScale、VTune、赛扬、Intel NetBurst 及 MMX 均为英特尔公司或其子公司在美国以及其它国家或地区的商标或注册商标。
* 其它品牌与品名可能是属于其它公司的资产。如需有关详细信息,请访问本公司的法律信息网站。
© 2007 英特尔公司版权所有
返回顶部