導入事例

インテル Parallel Studio XE 製品好評発売中» 詳細

製品の技術情報・評価ガイド» 詳細

製品に関する書籍を紹介» 詳細

iSUS

インテル® ソフトウェア開発ツールは、今日、ソフトウェアの高速化/並列化を求めるエンジニア、科学技術、マルチメディアなど広範囲にわたる企業や学術研究所で数多く使用されています。


最新の事例とお客様の声

インテル® Parallel Studio XE

HDR のレンダリング速度が 1.3 倍に向上
インテル® Parallel Studio XE を使用してインテル® AVX 向けにソフトウェアを最適化することにより、hotspot は 10 倍も速く検出され、HDR イメージのレンダリングが 1.3 倍も高速になりました。
Nik Software 社
インテル® Parallel Studio XE のスタティック・セキュリティー解析ツールは、簡単な設定で直観的に使用できます。そのユーザー・インターフェイスにより、特定のエラーのクラスやプロジェクトの特定のファイルに注目することができます。不要なものはフィルターで外すことができ、コードの変更後も、そのままフィルターをセットしておけます。これは、ただテキストを出力するツールよりも大きな利点があります。
MWH Soft 社
Mark Lewy 氏
インテル® Parallel Studio XE Windows* 版の解析機能にはうれしい驚きを感じました。特に、インテル® Parallel Studio XE に含まれるインテル® Inspector XE のメモリーおよびスレッド検出機能に感動しました。アプリケーションで変更を行い、再度解析し、その '前' と '後' の効果を簡単に比較できることは素晴らしいと思います。(インテル® Parallel Studio XE に含まれる) インテル® C++ Composer XEのコンパイラーは非常に強固なコンパイラーだと思います。ガイド付き自動並列化 (GAP) とアレイ・ノーテーション機能は、パフォーマンス向上に非常に役立ちました。インテル® Parallel Studio XE は Visual Studio* を使用する開発者に多くの機能をもたらしてくれます。
Ionix オーナー
Erik Van Grunderbeeck 氏

導入事例、お客様の声

インテル® Parallel Studio XE

最高のビデオ品質とパフォーマンスを保証 - Envivio Inc.
「リアルタイム・トランスコード・アプリケーションである4Caster C4* 製品の品質を改良して、最高のビデオ品質で最高のパフォーマンスの製品を迅速に市場に投入することが目標でした。インテル® Parallel Studio XE のスタティック・セキュリティー解析 (SSA) 機能を使用したところ、エンコーディング・チームに報告されるバグの数が少なくなり、開発者の生産性と市場への投入時間がどちらも改善されました。」 (Prallel Universe Issue6 より抜粋)
Jean Kypreos 氏
高度画像処理チーム・マネージャー、Envivio 社

最新の事例とお客様の声

インテル® コンパイラー

Windows* プラットフォーム用のインテルのコンパイラーにはいつも感心しています。新しいインテル® Visual Fortran Composer XE Windows* 版とインテル® C++ Composer XE Windows* 版は、ガイド付き自動並列化 (GAP) など、パフォーマンスを向上する素晴らしい機能を開発者に提供してくれます。両製品とも、Visual Studio* の最新エディションに問題なく統合されます。強化されたインテル® MKL とインテル® IPP では、さらにパフォーマンスが向上しました。これらのライブラリーはスピードを提供するだけでなく、幅広いアプリケーションをカバーし、エンジニアや科学者にとって優れたビルディング・ブロックです。ご自分の C++/Fortran アプリケーションにパフォーマンス向上を求める開発者は、インテル® ソフトウェア開発製品を試すべきでしょう。
Neubrex. Co., Ltd
シニアエンジニア
Dr. Artur Guzik
インテル® Fortran Composer XE に含まれるインテル® Fortran コンパイラーを使用していますが、新しいオブジェクト・ブラウザーがとても気に入っています。ルーチンが多いモジュールの参照が簡単になりました。コンパイラーも安定しており、素晴らしいパフォーマンスが得られます。我々は小さな会社ですが、インテル® Fortran の大ファンです!
Sugars International LLC
マネージャーWarner Weiss 氏
インテル® C++ コンパイラーの特に C++0x サポートが気に入ってます。可変引数テンプレート関数のデフォルトをテストし、SFINAE 式を確認できたのが良かったです。ライブラリー開発者にとって、これはテンプレート・メタプログラミングの煩雑さを大幅に軽減してくれる非常に強力な機能です。
ニューヨーク大学博士課程
Jesse Perla 氏

導入事例、お客様の声

インテル® コンパイラー

仮想衝突試験における新しい標準の作成 - Altair Engineering, Inc.
「要素数が 100 万を超える乗用車の正面衝突シミュレーションを 5 分以内に処理する業界初のシミュレーション・コードを記述することが目標でした。インテル® ソフトウェア開発製品を用いることで、5 分を切るという目標は達成され、全体的なパフォーマンスは約 10 倍になりました。お客様の要件を満たしたことにより、Altair に対する顧客満足度が向上しました。」(Prallel Universe Issue6 より抜粋)
Uwe Schramm 博士
HYPERWORKS 部門 CTO, Altair Engineering, Inc.
最新のインテル® Fortran コンパイラー、11.1 をテストしました。これはお勧めの製品です。高速なコードを量産する、非常に安定した信頼性の高いコンパイラー です。11.0 から移行しただけで最大 10% のパフォーマンス向上を達成できました。また、インテルからも質の良いサポートを受けられます。これからも良い仕事を続けてください。

Steve Elgar 殿
WHOI [Woods Hole Oceanographic Institute]Woods Hole, MA
インテル® C++/Fortran コンパイラーを 64 ビットのスレッド化アプリケーションに使用しています。最初に使用したときの印象が非常に良く、ソフトウェアのスレッド化に役立つ Open MP* 3.0 などの新しい機能に満足しています。コンパイラーは安定しており、高速です。10.1 リリースから移行しただけでパフォーマンスが 10% 程度向上しました。ソフトウェアの開発者にはインテルのコンパイラーをお勧めします。
Michael Ehrig 殿
Hewlett-Packard Boeblingen、ドイツ
マルチコア・プロセッサー向け流体解析ソフトウェアの高速化 - 株式会社ソフトウェアクレイドル
インテル® Xeon® プロセッサー 5500 番台上でインテル® コンパイラーとインテル® MPI ライブラリーを組み合わせて使用した場合と、Microsoft Visual Studio と MPICH を組み合わせた場合を比較したところ、実に平均 12.25% の性能向上が達成されました。
黒石 浩之 殿
株式会社ソフトウェアクレイドル
インテル コンパイラーで計算機合成ホログラムの計算を行いました。実際の計算では、四則演算のループが中心ですが、特に int 型の計算が速くなりました。コンパイラーの依存性を確かめる実験を行ったところ、計算機合成ホログラムでフレネル近似・cos テーブルというものを用いて int 型の計算を行い、

gcc -O3  21.48 [s]
icc  13.27 [s]
物体点数 284 点

という結果を得ることができました。

また、Core2Duo を使った場合、Linux 上で検証を行ったところ 1 コアに対して 1.98 倍程度のパフォーマンス向上になりました。

千葉大学 伊藤智義研究室 殿
Web http://brains.te.chiba-u.jp/
モンテカルロ・シミュレーションによる金融商品のプライシングシステムを開発しております。インテルコンパイラーを用いて、計算時間がどの程度の改善が見られるかを検証を行いました。

        マシン: Dell Optiplex 755
        OS: Windows VistaR Business 32ビット
        CPU: インテルR CoreTM 2 Duo プロセッサー @ 3.00GHz
        メモリ: 2GB
        コンパイル・オプション: /QxT /QaxT /Qipo
        比較対象: Visual C++ 6.0

その結果、計算時間を単純比較して70%ほど早くなりました。
大手ソフトウェア開発エンジニア殿
半導体製造用の内製シミュレーション開発をしております。インテルコンパイラーを使用し、最適化オプション(/O3 /Qip /QxT /Qopenmp)を使用して並列化を行いました。結果、並列化を行う前に比べて約1.5倍のパフォーマンスを得ることができました。これから、インテル VTune アナライザーを使用してOpenMP のチューニング作業を行う予定です。
大手 半導体メーカー エンジニア殿
有限差分時間領域法(FDTD法)を使った電磁界解析シミュレーションソフトを開発しています。インテル・コンパイラーにて最適化オプション (/Qfp-speculationfast /QaxT /QxT /Qparallel)を付加することにより、Visual C++(Win 32)に比べて、計算時間を 40% 短縮 (スループット 1.66 倍) することができました。

大手 光デバイス開発 エンジニア 殿
開発中のアプリケーションの概要、
FDTD法による電磁界シミュレータ(Fortran90互換コードで作製)

        OS: Windows XP x64 Edition
        CPU: Dual Core Xeon(5130) 2.0GHz + 2GByte RAM
        使用したコンパイルオプション: /QxT
        比較対照となったコンパイラー: Compaq Visual Fortran 6.0

「時間領域差分法を使って電磁界解析を行っています。解析手法では多重ループを多用するので新しいコンパイラに期待して購入しました。コンパイルオプションの最適化を行っていないですし、正確な時間を計ったわけではないのですが、今まで5〜6時間かかってやっと終わる計算が3〜4時間で完了できるようになりました。高速化の面では今後さらに改善の余地がかなりあります。また、本解析手法ではメモリ使用可能量が解析規模を決めるので、INTEL64に対応して大容量メモリを使えるようになったことが非常に有効だったと感じています。」

国立大学法人 通信系研究室
「平面2次元計算をインテル Fortran コンパイラー Linux 版を使用してコンパイラーの最適化オプション -axp または OpenMP による並列化を使用したところ、OS は異なるものの、DIGITAL Visual Fortran Windows 版に比べて高速化が実現できました。」

・オプション:-axp で実施した場合
  計算時間 914.1min → 474.4min

・オプション:-openmp で実施した場合
  計算時間 914.1min → 118.7min

株式会社 水工リサーチ 牛山殿
「Intel C++ Compiler for Mac OS をある画像処理のプログラムで採用したところ処理時間が約1/2になりました。」

Macintosh 向けソフトウェア請負開発エンジニア殿
【アプリケーションの概要】
信用リスク計量のためのモンテカルロ・シミュレーション

【コンパイル・オプション】/02
(注)まだこのソフトの操作に慣れていないため、他のコンパイル・オプションではもっと速くなるのかもしれません。

【比較対象コンパイラ】
Microsoft Visual C++ .NET 2003

【パフォーマンス】
一定のシミュレーション回数での計算時間は、約1/2になりました。シミュレーション ループ内での同一関数の複数呼び出しをインライン化して高速化されたのではないかと推測しています。プログラムを書く段階では、同一の関数は外出しした方がコードがコンパクトになるため好まれますが、プログラムの実行段階のことを考えると、何度も使う関数はインライン化した方が速い、という「当り前のこと」に改めて気づきました。
大手金融機関 開発エンジニア殿
インテル Core 2 Duo プロセッサー上で医用画像処理を最適化 - 株式会社ケイ・ジー・ティー殿
株式会社ケイ・ジー・ティーでは、3 次元医用画像処理ソフトウェア「Real INTAGE (リアルインテージ)」の開発にインテル コンパイラーを使用し、インテル 64 対応による高速処理のほかインテル Core 2 Duo プロセッサー上でのプログラムの最適化、およびインテル SIMD 命令の活用による高速ボリュームレンダリングを実現しました。
グリッドシステム全体のパフォーマンスを向上 - 産業技術総合研究所 (AIST)
「インテル® Itanium® システム上では GNU と比べて大幅な高速化が実現し、また、インテル® Xeon(TM) プロセッサー搭載システムで構成されるクラスタシステム上ではスピードと安定性が共に優れていました。」
博士 (理学) 池上努 殿
グリッド研究センター 科学技術基盤チーム
独立行政法人 産業技術総合研究所
デュアルコア向け最適化によるオーディオ変換アルゴリズムの高速化 - ソニーデジタルネットワークアプリケーションズ株式会社 (SDNA)
「インテル® ソフトウェア開発製品を利用して最適化とマルチスレッド化を行うことで、従来の3.5 倍の処理性能を実現することができました。アプリケーションの高速化を短期間で実現するには、VTune(TM) アナライザーやインテル® コンパイラーなど優れた開発ツールが必要不可欠であるといえます。」

大河内俊雄 殿
ソニーデジタルネットワークアプリケーションズ株式会社
「私は、関数など "大自由度システムの推定問題" を研究していますが、計算機実験による実証は大変困難です。具体的には、ある非線型微分積分方程式を境界条件の下で数値的に解くことになり、ニュートン法を適用して、10万元程度の連立1次方程式を数万回繰り返し解く作業に帰着させます。
幸い、私の問題の場合には高速な解法が存在することが知られていますが、その他の処理と合わせて、インテルのコンパイラーを用いても 5〜6 時間程度の計算時間が掛かります。また、システムサイズを増やせば、すぐに数日から 1 週間程度の計算時間が必要になります。
しかし、やはりインテルのコンパイラーを用いれば、gcc に比べて格段に実行時間が減らせますので、大変役に立っています。」

国立大学 工学部 情報工学科殿
「画像パターンマッチング処理にてインテルコンパイラーを使用した場合、VS.NET2003の場合と比較して評価アルゴリズムの速度が約 30% 向上しました。」

大手 宇宙情報システム開発 会社殿
インテル C++ コンパイラーでパフォーマンスが約 40 % 向上 - 有限会社ブロードマイン殿
有限会社ブロードマインより販売されている TRYCUT2000 の中の機能のひとつである OFFSET 処理機能にインテル C++ コンパイラーを利用した際、アプリケーションの実行速度が 40 % 程向上しました。
Oracle データベースのパフォーマンスの大幅な向上 - Oracle
「Oracle9i Database から最大限のパフォーマンスを引き出す必要がありました。これがインテル® コンパイラーを選んだ理由です。」
Mark MacDonald 殿
Windows テクノロジー・グループ、Oracle
Linux 上で高速な流体力学モデリングを実現 - Fluent Inc.
「GNU C と Linux 版インテル® C++ コンパイラーで当社の標準ベンチマークを実行したところ、インテル® コンパイラーでは最大 37% もパフォーマンスが向上しました。」
Dipankar Choudhury 博士
CTO、Fluent Inc.
HPC アプリケーションで宇宙の起源を解明 - スーパーコンピューティング・センター
「Linux 版インテル® Fortran コンパイラーにより、アプリケーションが 24.5% から 31.5% ほど高速化されました。このパフォーマンスの改善は、われわれのアプリケーションに劇的な変化をもたらしました。」

James Murray 博士
天文学者、システムアドミニストレータ
スインバーン大学天体物理学/スーパーコンピューティング・センター
「スキャンライン レイトレーシングによる3Dレンダリングのコードをインテル C++ コンパイラでコンパイルしたところ、関数のインライン化等コンパイラの性能にかなり依存したコード部分があったことにもより、かなり速度差があって驚きました。
これだけコンパイラの性能があれば保守性、可読性を優先した上で、より上位の基本的アルゴリズムの改良による高速化に専念することができます。

元の環境は VisualC++ 2003 Standard です。
(オプションは Standard なため /O2 しか選べません。)
その前は VC6.0、CodeWarrior8.0 でもビルドしてましたがこれらは速度的にあまり変わりありませんでした。

使用した インテル C++ コンパイラーのオプションは次の通りです。
    Maximize Speed plus High Level Optimization ( /O3 intel )
    Global Optimizations: Yes
    Inline Function Expansion: Any Suitable
    Enable Intrinsic Functions: No
    Floating Point Precition Improvement: None
    Favor Size or Speed: Favor Fast Code
    Omit Frame Pointers: No
    Enable Fiber-safe Optimizations: No
    Optimize For Windows Application: Yes

    Use Intel® Processor Extensions: PenIII
    Require Intel Processor Extension: None
    Loop Unrolling:
    Parallelization: No

最適化オプションをほとんどオフにしたデバッグ用ビルドの場合、VisualC++ 2003 と Intel C++ コンパイラとの速度差はあまりありませんでした。 今後、どのオプションによってどれだけ速くなるのかは検証する予定です。」

レンダリング開発者殿

   

SPEC CPU 2000 ベンチマーク測定結果


  1. Intel Compiler for Windows と SmartHeap を使用した場合


  2. Intel Compiler for Linux を使用した場合

※株式会社 日立製作所殿よりご提供いただいた、インテル コンパイラーを使用したベンチマーク情報です。

最新の事例とお客様の声

インテル® VTune Amplifier XE

新しいインターフェイスはとても使いやすく、気に入っています。インテル® VTune™ Amplifier XE により、hotspot の特定と最適化による効果の評価に不可欠な正確かつ詳細なパフォーマンス・データが得られました。
Nik Software Inc.パフォーマンス・エンジニア
Daniel Schwarz 氏
インテル® VTune™ Amplifier XE のおかげで作業が簡単になり、開発プロセスがスピードアップしました。さらに、パフォーマンスも 20% 〜 360% 向上しました。
Open Cascade SAS 社
Sergey Zaritchny 氏

インテル® Inspector XE

インテル® Inspector XE の直感的なユーザー・インターフェイスと強力な検出機能により、コード中のメモリー/スレッドエラーをすぐに特定することができ、生産性が向上しました。使いやすいインテル® Inspector XE は、検出の種類やレベルをカスタマイズでき、メモリーやマルチスレッド・コーディングの不具合をより素早く効率的に発見できて、時間の節約になりました。
Euriware 社 Open Cascade
ソフトウェア開発マネージャー
Sergey Zaritchny 氏
弊社は画像処理とオブジェクト検出を行っています。ソースから画像を取り出し、フレームを複数のスレッドに分けて並列処理しています。インテル® Inspector XE を使用することで、ソースからフレームに処理する際の隠れたデータ競合を発見しました。この問題のソリューションにより、フレームをより速く処理する方法を見つけられ、結果として処理自体が高速になり、アプリケーションの安定性が向上しました。
OTRADA Inc
CEO、CTO
Alex Migdalski 氏

導入事例、お客様の声

インテル® VTune パフォーマンス・アナライザー

時間がかかるレンダリングの解析に VTune アナライザーを活用 - SAP ジャパン株式会社
「VTune™ アナライザーはソフトウエア開発者専用のツールのように思われがちですが、システム・インテグレーションの分野においても解析ツールとして十分に活用することができます。」

渡邊周二 殿
コンピテンス・センター テクニカルマネージャ
SAP ジャパン株式会社/アライアンス本部
「自社ミドルウェア製品のサーバー・アプリケーションを開発する際、VTune アナライザーのコールグラフ・プロファイリングを採取した結果、不要なファイルのアクセス処理、およびある同期処理で必要以上に Sleep 処理が行われていることが発見されました。これらの 2 つを改善した結果、30% から 50% の性能改善がみられました。」

大手ソリューション プロバイダ殿
「インテル® VTune パフォーマンス・アナライザーは、新機能追加時に多発するパフォーマンス悪化の早期発見に役立ちます。この迅速な分析によって、パフォーマンス問題を修正しやすい開発サイクルのうちから、高いパフォーマンス・レベルを維持できるようになります。インテル® VTune パフォーマンス・アナライザーにより、日々の開発業務への統合が容易になりました。」

Abaqus Inc. 殿
高性能コンピューティングに最適化されたソリューション - NEC Solutions (America), Inc.
「基本的なパフォーマンス・チューニングの作業を完了すると、パフォーマンスが 20〜50% も向上しました。」

Arvind Amin 博士
HPC アプリケーション担当プロジェクト・マネージャ
NEC Solutions (America), Inc.
インテル® VTune アナライザーLinux* 版は、とても素晴らしいです。有効なデータを得るのが、迅速かつ簡単です。私はこのツールをおすすめします。私は今まで、必要な情報をこれほど容易に得られるツールに出会ったことがありません。」

Abaqus Inc. 殿

導入事例、お客様の声

インテル® クラスター・ツールキット

理化学研究所: 「MPI プログラムのチューニングでインテル トレース・アナライザー/コレクターが大変役立ちました。インテル トレース・アナライザー/コレクターで解析したところ、MPI の通信で、ノンブロッキング通信を多数発行しているところで性能が出ていないことが発見でき、これを1対1のブロッキング通信に分割したところ、通信時間は半分程度に高速化されました。 また、インテル トレース・コレクターでプログラムに情報を埋め込むことで、各関数の実行時間やロードバランスを調べることができ、高速化すべきところが容易にわかるようになりました。」

理化学研究所は、物理学、化学、工学、生物学、医科学など幅広い分野にわたり、基礎 研究から応用研究まで多様な研究活動を展開しています。

博士(理学) 古石 貴裕 殿
戎崎計算宇宙物理研究室
独立行政法人 理化学研究所
SDSC: 「通信全体のコストを簡単に特定でき、さらに各 MPI ルーチンで費やされた時間に細分化できます。プロセス数に関係なく、ロード・インバランスの程度と原因も簡単に特定することが可能です。メッセージの統計表示機能は、通信を行っているプロセッサーがグリッド上に表示されて全体を概観できる、特に役立つ機能です。また、シミュレーションの進行に応じて、通信モードで費やされた時間の参照やフォーカスができるのも便利な機能です。」

Dominic Holland 氏
SDSC
ソウル市立大学校:「インテル® クラスター・ツールキットを評価し、インテルのソフトウェア・ツールを使用することでインテル® プラットフォーム上でより優れたパフォーマンスを得られるという結論に達しました。インテルのコンパイラーにより、各アプリケーションでこれまでにないパフォーマンスが得られ、また、インテル® クラスター・ツールキットによって、クラスターシステムがどのように実行されているか、そしてどのように改善できるかを理解できました。インテル® クラスター・ツールキットを購入しましたが、これは、新しくインテル® プロセッサー・ベースのクラスターシステムを購入する最も重要な理由の 1 つでした。」

Jinwoo Park 氏
SPCC シニア・システム・マネージャー
ソウル市立大学校、韓国
EM Software & Systems:「FEKO 電磁界コードは、さまざまな並列環境 (例: さまざまなサイズのクラスター、共有メモリーマシン) で実行され、並列化が容易ではない複雑な数値アルゴリズムを利用しています。インテル® トレース・アナライザー/コレクターは、FEKO 並列通信パターン、さらにメッセージパッシングの最適化に非常に役立ちました。その結果、ISV 電磁気クラスター・アプリケーションで優れたパフォーマンスを発揮させることができました。」

Ing. Ulrich Jakobus 博士
テクニカル・ディレクター
EM Software & Systems
TFLOPS の壁を越えることができた (英語) - ac3:
「インテル® ソリューションを利用したことで、大規模クラスターの設計をを行い、ソフトウェアのパフォーマンスを最大限に引き出すことができました。」

The Australian Centre for Advanced Computing and Communications (ac3)

最新の事例とお客様の声

インテル® MKL

構造解析プログラムでの並列化・高速化事例:千葉大学 野口・柏崎研究室 殿
「高速化前の構造解析プログラムでは、大規模な計算を行うため計算時間がかかるという問題がありました。プログラムを調査したところ、その大部分は行列ソルバーが占めていました。そこで、スカイライン法を用いていたソルバーの部分をインテル® MKL の PARDISO に変更することで高速化を図りました。」
続きは、株式会社計算力学研究センター様のページをご覧ください。

導入事例、お客様の声

インテル® MKL

「私たちは非線形構造解析プログラムを開発しており、開発環境、エンドユーザー環境としてIntelCPU のマシンを想定しています。それに伴い、コンパイラー、数値計算ライブラリーはインテル社製のものを使わせていただいております。

プログラムの内容は
@行列の設定、A境界条件の設定、B行列の求解、C解の更新で、非線形性が強いとこれらを数千回以上繰り返します。計算時間の多くを占めるのはBの部分になります。MKLライブラリを用いることによりここが非常に高速化でき、しかもDual、Quad などのマシンを用いるとおよそ1.5倍、2倍の高速化が実現できました。

この計算性能はハイエンドワークステーションと比較しても2倍くらいで、今まで一昼夜かけて計算していたものが半日で行えることになり、非常に有効です。
またB以外の部分は現在並列化できていないけれど、今後スレッド化手法により並列高速化が可能と思われ取り組んでいく予定です。」

株式会社 計算力学研究センター 荒川 殿
「SIMD 演算を利用したいと考えていたので、本製品にはそのためのクラスライブラリが含まれているので、大変満足しました。ただ、Fvec クラスから Ivec クラスへの変換(F32vec4toI32vec4、F32vec4toI32vec8 など 4 要素を一括して変換する関数)などの型変換を充実させ、これら変換を実現する利用方法の詳細を説明したドキュメントが揃っているとより使いやすくなると思います。」

国内大手研究機関殿
数値演算性能の最適化 - NAG Ltd.
「インテル® MKL ルーチンは優れた品質と充実度を誇る NAG ライブラリーを完全に補完する役割を果たします。これらを組み合わせることで、NAG のユーザーは多岐にわたる高性能コンポーネントを利用できるようになっています。」
Brian Ford 博士
常務取締役、NAG Ltd.
「PAM-CRASH (衝撃・衝突解析ソフトウェア) とPAM-STAMP (プレス成形解析ソフトウェア) は、インテルRMKL のパフォーマンスに依存しています。私たちは、メモリ使用量とSMP (対称型マルチプロセッサー) パフォーマンスの両方の結果に満足しています。」
ESI Computational Structural Mechanics Group 殿
「インテル® MKL から、最新のインテル® SSL ライブラリーのサブセットを呼び出して作業しています。特に分散/共分散法やロバスト法などの計算に使用していますが、非常に好調です。」
REvolutionComputing 殿
「インテル® MKL を使用したことで、ベンチマークの結果が43〜71%向上しました。この結果は非常に感動的です。」
ABAQUS, Inc. 殿
「インテル® MKL は、ANSYS が、インテル® プロセッサー上での高いパフォーマンスを発揮するのを助け、10 年以上にわたり、私たちの工学シミュレーション・ソフトウェアの動力となっています。インテル® MKL を使用したインテル・マルチコア・プロセッサーは、私たちが、ワークステーションからサーバシステムまで幅広く、高いパフォーマンスを発揮するのに役立っています。インテル® MKL による継続的な最適化は、ANSYS ソフトウェアのユーザーにとって、最新のインテル® プロセッサー上での、最善のパフォーマンスを保障します。」
ANSYS, Inc. 殿

インテル® IPP

「半導体の検査装置で使用しているアプリケーションの開発をおこなっています。インテル IPP 5.3 および インテル C++ コンパイラーを使用しました。結果、飛躍的なパフォーマンスの向上に成功しました。」

大手 メカトロニクス開発エンジニア 殿
「自社の画像処理システムを開発する際にインテル IPP ライブラリを導入したところ、従来の C++ 言語で開発した画像処理と比べて、2 〜 10 倍のパフォーマンスの向上がありました。」

使用した IPP 関数と処理時間の改善具合
IPP 関数 処理時間 元の処理時間 処理内容
ippiFilter_8u_C1R 2.2 msec 4.0 msec 4.0 msec 8 近傍フィルター(ノイズ除去)
ippiFilter_8u_C1R 2.2 msec 10.2 msec 8 近傍フィルター(シャープ化)
ippiFilterMedian_8u_C1R 1.1 msec 48 msec メディアン・フィルター
ippiFilterLaplace_8u_C1R 1.6 msec 9.6 msec ラプラシアン・フィルター
ippiAbsDiff_8u_C1R 1.6 msec 2.6 msec 2 画面差分
ippiCompareC_8u_C1R 0.3 msec 1.8 msec 2 値化

国内エンジニアリング会社殿
成功への近道 - ImageCom
「良質で高解像度のビデオ映像を個人のデスクで視聴したり、または移動中に鑑賞できる機能が求められています。ImageCom では、このような要望に応えるアプリケーションを提供しています。このアプリケーションの開発には、インテル® インテグレーテッド・パフォーマンス・プリミティブおよびインテル® C++ コンパイラーがその最適化において重要な役割を果たしています。」

Thomas Dove 殿
CEO、ImageCom

インテル® TBB

インテル® TBB の新しいフローグラフ機能を使用することで、これまで不可能だった、数千の相互に関連する非常に大きなタスクグラフを約1 週間で並列化することができました。
Pacific Northwest National Laboratory GCAM
プロジェクト・サイエンティストRobert Link 氏
思わず引き込まれるリアルな PC ゲームの世界を実現 - The Creative Assembly 社
「没入型でリアルなゲーム環境の開発をサポートするため、マルチコア PC の能力を活用する必要がありました。インテル® TBB を使用したことで、The Creative Assembly のプログラマーは、提供されるコアの数に応じてスケーリングされるストラテジー・ゲーム用の将来性の高いエンジンを作成し、プロセッサーによる制限から解放されました。以前よりもシステム要件が低くなったにもかかわらず、より大きなアニメー ションが追加されたことで、Napoleon: Total War* が提供するユーザー 体験はよりリアルになり、圧倒的な臨場感を実現しました。」 (Prallel Universe Issue6 より抜粋)
Yuri O’Donnell 氏
シニア・エンジン・コーダー、The Creative Assembly 社

導入事例、お客様の声


分野
ビデオ、ブロードキャスティング分野
概要
3 つのビデオ画面 (テレビ、PC、携帯電話) をサポートする統合化ソリューションを提供する唯一の企業として、Envivio は、あらゆる種類のネットワーク上の、モバイルから HD までさまざまなマルチメディア・デバイスに対応する IP ビデオを開発しました。高い業績が期待される電話会社と放送会社向けの IP ビデオ統合化エンコーディング・ソリューションを提供する革新的企業の Envivio は、優れたソフトウェア・ツールがもたらす恩恵をよく理解しています。シングルコア・プラットフォームで HD ビデオをエンコーディングするという課題に直面したとき、Windows* 用の並列化ツールであるインテル® Parallel Studio は最適な選択でした。
課題
  • あらゆる種類のネットワーク上でいつでも IP ビデオを提供する。
  • シングルコアでは、MPEG2 から H.264 への HD ビデオのリアルタイム・エンコーディングが満足にできない。
解決方法
  • インテル® Parallel Inspector とインテル® Parallel Amplifier は、リアルタイム・エンコーディングが可能な並列アプリケーションの開発、最適化を支援する。
  • メモリーの誤使用やスレッドの並列性問題が発生しないため、開発ライフサイクルの初期段階における対応が簡素化される。
お客様の声

「インテル® Parallel Studio は、弊社のソフトウェア製品の開発をグローバルにスピードアップしてくれる製品です。」

「MPEG2 から H.264 に HD コンテンツを変換するにあたって、シングルコアではリアルタイム・エンコーディング処理を満足にできませんでした。」

「インテルの新しい分析ツールとプロファイリング・ツールで新しい Envivio 4Caster* シリーズのトランスコーダーの開発を迅速に効率良く進めることができました。特に、インテル® Parallel Inspector とインテル® Parallel Amplifier を使用することで、マルチコア、マルチスレッド環境におけるコードの信頼性とパフォーマンスが向上し、ソフトウェア開発期間全体を短縮できました。検証段階では、安全な実装のおかげで、機能障害が減り、不具合の追跡も簡単です。」
Eric Rosier 氏、副社長、エンジニアリング、Envivio 社

 

分野
テレコミュニケーション
概要
RADVISION* は、IP および 3G ネットワークにおける統合ビジュアル・コミュニケーションを実現する製品とテクノロジーのリーディング・プロバイダーです。受賞歴もある SIP Toolkit は、SIP (セッション確立プロトコル) アプリケーションの開発時間を大幅に短縮する、強力で汎用的なツールのセットです。SIP Toolkit を利用すると、開発者はクライアント、サーバー、テストツール、その他を含む、あらゆる種類のアプリケーションを実装することができます。RADVISION 社は、プロセス間通信と同期における問題を発見し、コードを検査して実行に時間を要している場所と原因を特定する必要性に迫られました。そこで、待機プロセスとその原因の解明にインテル® Parallel Studio、インテル® VTune(TM) パフォーマンス・アナライザー、インテル® スレッド・プロファイラーおよびインテル® スレッド・チェッカーを使用しました。これにより、コードがさまざまなセクションで費やしている時間と、調査が必要な場所に関する詳細情報も取得できました。また、Microsoft* Visual Studio* IDE との統合により、コード分析もより簡単でした。
課題
  • コア/プロセッサー数に応じてパフォーマンスをスケールアップする。
結果
  • コアの利用率が著しく改善されました。
  • 毎秒ごとのサーバー呼び出し回数が大幅に増加しました。
お客様の声

「インテルの最先端のマルチスレッド最適化ツールを使用することで、ごく短期間に弊社製品のパフォーマンスを大幅に向上できたことをうれしく思います。」
Sagi Subocki 氏、製品マネージャー
テクノロジー・ビジネス・ユニット
RADVISION

 

分野
科学技術コンピューティング
概要
Open CASCADE は、科学技術計算業界でクライアント向けに複雑なソフトウェア・シミュレーション・ツールを統合するためのソリューションを開発しています。研究するタスクは複雑であるため、Open CASCADE とクライアントにとって、アプリケーションのパフォーマンスの高さは非常に重要です。インテル® Parallel Studio の柔軟性、高度なエラー検証とチューニング機能、および C++ 開発環境により、Open CASCADE のソフトウェア・ツールはより優れたものとなりました。
課題
  • 複雑なソフトウェア・シミュレーションのパフォーマンスを最大限にする。
  • 正確な科学技術計算が必要なクライアントのためにエラーとボトルネックをすばやく取り除く。
解決方法
  • インテル® Parallel Inspector とインテル® Parallel Amplifier を使用することでアルゴリズムが改善され、全体のパフォーマンスが最大 2 倍向上した。
  • 発見が困難なメモリーリークが検出され修正された。
お客様の声

「インテル® Parallel Amplifier により、共通関数が hotspot であることが示されました。その後の調査により、スマートポインターに起因する小さなオーバーヘッドが大量の呼び出しの結果によって相当な時間を要していることがわかりました。このケースは通常のポインターに変更可能だったため、通常のポインターに変えたところ、アルゴリズム全体が最大 10 倍も高速化されました。」

「プロファイリング・ツールを使用しないでこれらのボトルネックを発見することは困難です。インテル® Parallel Amplifier による最適化は簡単でした。関数を 1 度呼び出して記憶し、アルゴリズムの任意の場所で再使用するだけです。」

「Open CASCADE 開発チーム (および弊社の顧客) は、インテル® Parallel Studio によって成し遂げられたパフォーマンスと信頼性の向上を高く評価しています。」
Vlad Romashko 氏、ソフトウェア開発マネージャー、Open CASCADE S.A.S.

 

分野
研究
概要
ドイツの有名な工科大学の 1 つであるアーヘン工科大学 (RWTH Aachen University) では、ヨーロッパ最大級のハイパフォーマンス・コンピューティング (HPC) クラスターを運用しています。ヨーロッパの大学と研究所のコミュニティーに計算と諮問リソースの両方を提供しており、アーヘンの技術スタッフは並列化の中心的存在となっています。情報基盤センターは、独自のコードを記述して詳細な分析を行うメカニカルエンジニアを含むクライアントからの相談に対し実地指導を行うことで、並列化作業を支援しています。アーヘンでは、すべてのクラスター・プロセッサー・コアを最大限に活用するため、クライアントの環境を Linux* から Windows* へ移行する計画でした。また、移植と並列化に関連する多くの複雑な問題に対処できる、適切な並列化ストラテジーに基づいてクライアントがアプリケーションを開発することも希望していました。そこで、ランタイム分析とシリアル・チューニングから、hotspot の検出、デバッグ、正当性の検証まで、開発ライフサイクル全体にわたってインテル® Parallel Studio を採用しました。インテル® Parallel Studio との統合により、Visual Studio* 環境が拡張し、マルチコア・プラットフォームで最大限のパフォーマンスが得られるアプリケーション開発の基盤が提供され、並列アプリケーションをより簡単に開発できるようになりました。
課題
  • すべてのクラスター・プロセッサー・コアを最大限に活用するため、クライアントの環境を Linux* から Windows* へ移行する計画でした。また、移植と並列化に関連する多くの複雑な問題に対処できる、適切な並列化ストラテジーに基づいてクライアントがアプリケーションを開発することも希望していました。
結果
  • アーヘンおよびクライアントの処理能力が向上し、並列化が促進されました。
  • インテル® Parallel Studio により、分析の実行と生産性向上のための簡単なアプローチが提供されました。
お客様の声

「インテル® Parallel Studio は、Microsoft* Visual Studio* を拡張して、エンドツーエンドの統合並列化開発環境を実現します。」
Christian Terboven 氏
テクニカルエンジニア、情報基盤センター
アーヘン工科大学

 
. . . . . .