インテル® ソフトウェア開発ツールは、今日、ソフトウェアの高速化/並列化を求めるエンジニア、科学技術、マルチメディアなど広範囲にわたる企業や学術研究所で数多く使用されています。
最新の事例とお客様の声
インテル® Parallel Studio XE
|
HDR のレンダリング速度が 1.3 倍に向上
インテル® Parallel Studio XE を使用してインテル® AVX 向けにソフトウェアを最適化することにより、hotspot は 10 倍も速く検出され、HDR イメージのレンダリングが 1.3 倍も高速になりました。
Nik Software 社
MWH Soft 社 Mark Lewy 氏 Ionix オーナー Erik Van Grunderbeeck 氏 |
導入事例、お客様の声
インテル® Parallel Studio XE
|
最高のビデオ品質とパフォーマンスを保証 「リアルタイム・トランスコード・アプリケーションである4Caster C4* 製品の品質を改良して、最高のビデオ品質で最高のパフォーマンスの製品を迅速に市場に投入することが目標でした。インテル® Parallel Studio XE のスタティック・セキュリティー解析 (SSA) 機能を使用したところ、エンコーディング・チームに報告されるバグの数が少なくなり、開発者の生産性と市場への投入時間がどちらも改善されました。」 (Prallel Universe Issue6 Jean Kypreos 氏
高度画像処理チーム・マネージャー、Envivio 社 |
最新の事例とお客様の声
インテル® コンパイラー
|
Windows* プラットフォーム用のインテルのコンパイラーにはいつも感心しています。新しいインテル®
Visual
Fortran Composer XE Windows* 版とインテル® C++ Composer XE
Windows* 版は、ガイド付き自動並列化 (GAP)
など、パフォーマンスを向上する素晴らしい機能を開発者に提供してくれます。両製品とも、Visual Studio*
の最新エディションに問題なく統合されます。強化されたインテル® MKL とインテル® IPP では、さらにパフォーマンスが向上しました。これらのライブラリーはスピードを提供するだけでなく、幅広いアプリケーションをカバーし、エンジニアや科学者にとって優れたビルディング・ブロックです。ご自分の
C++/Fortran アプリケーションにパフォーマンス向上を求める開発者は、インテル® ソフトウェア開発製品を試すべきでしょう。
Neubrex. Co., Ltd
シニアエンジニア Dr. Artur Guzik インテル® Fortran Composer XE に含まれるインテル® Fortran
コンパイラーを使用していますが、新しいオブジェクト・ブラウザーがとても気に入っています。ルーチンが多いモジュールの参照が簡単になりました。コンパイラーも安定しており、素晴らしいパフォーマンスが得られます。我々は小さな会社ですが、インテル®
Fortran の大ファンです!
Sugars International LLC
マネージャーWarner Weiss 氏 インテル® C++ コンパイラーの特に C++0x
サポートが気に入ってます。可変引数テンプレート関数のデフォルトをテストし、SFINAE
式を確認できたのが良かったです。ライブラリー開発者にとって、これはテンプレート・メタプログラミングの煩雑さを大幅に軽減してくれる非常に強力な機能です。
ニューヨーク大学博士課程
Jesse Perla 氏 |
導入事例、お客様の声
インテル® コンパイラー
|
仮想衝突試験における新しい標準の作成 「要素数が 100 万を超える乗用車の正面衝突シミュレーションを 5 分以内に処理する業界初のシミュレーション・コードを記述することが目標でした。インテル® ソフトウェア開発製品を用いることで、5 分を切るという目標は達成され、全体的なパフォーマンスは約 10 倍になりました。お客様の要件を満たしたことにより、Altair に対する顧客満足度が向上しました。」(Prallel Universe Issue6 Uwe Schramm 博士
HYPERWORKS 部門 CTO, Altair Engineering, Inc. Steve Elgar 殿
WHOI [Woods Hole Oceanographic Institute]Woods Hole, MA Michael Ehrig 殿
Hewlett-Packard Boeblingen、ドイツ インテル® Xeon® プロセッサー 5500 番台上でインテル® コンパイラーとインテル® MPI ライブラリーを組み合わせて使用した場合と、Microsoft Visual Studio と MPICH を組み合わせた場合を比較したところ、実に平均 12.25% の性能向上が達成されました。 黒石 浩之 殿
株式会社ソフトウェアクレイドル gcc -O3 21.48 [s] という結果を得ることができました。 また、Core2Duo を使った場合、Linux 上で検証を行ったところ 1 コアに対して 1.98 倍程度のパフォーマンス向上になりました。 マシン: Dell Optiplex 755 OS: Windows VistaR Business 32ビット CPU: インテルR CoreTM 2 Duo プロセッサー @ 3.00GHz メモリ: 2GB コンパイル・オプション: /QxT /QaxT /Qipo 比較対象: Visual C++ 6.0 その結果、計算時間を単純比較して70%ほど早くなりました。
大手ソフトウェア開発エンジニア殿
大手 半導体メーカー エンジニア殿
大手 光デバイス開発 エンジニア 殿
FDTD法による電磁界シミュレータ(Fortran90互換コードで作製) OS: Windows XP x64 Edition CPU: Dual Core Xeon(5130) 2.0GHz + 2GByte RAM 使用したコンパイルオプション: /QxT 比較対照となったコンパイラー: Compaq Visual Fortran 6.0 「時間領域差分法を使って電磁界解析を行っています。解析手法では多重ループを多用するので新しいコンパイラに期待して購入しました。コンパイルオプションの最適化を行っていないですし、正確な時間を計ったわけではないのですが、今まで5〜6時間かかってやっと終わる計算が3〜4時間で完了できるようになりました。高速化の面では今後さらに改善の余地がかなりあります。また、本解析手法ではメモリ使用可能量が解析規模を決めるので、INTEL64に対応して大容量メモリを使えるようになったことが非常に有効だったと感じています。」
国立大学法人 通信系研究室
・オプション:-axp で実施した場合 計算時間 914.1min → 474.4min ・オプション:-openmp で実施した場合 計算時間 914.1min → 118.7min
株式会社 水工リサーチ 牛山殿
Macintosh 向けソフトウェア請負開発エンジニア殿
信用リスク計量のためのモンテカルロ・シミュレーション 【コンパイル・オプション】/02 (注)まだこのソフトの操作に慣れていないため、他のコンパイル・オプションではもっと速くなるのかもしれません。 【比較対象コンパイラ】 Microsoft Visual C++ .NET 2003 【パフォーマンス】 一定のシミュレーション回数での計算時間は、約1/2になりました。シミュレーション ループ内での同一関数の複数呼び出しをインライン化して高速化されたのではないかと推測しています。プログラムを書く段階では、同一の関数は外出しした方がコードがコンパクトになるため好まれますが、プログラムの実行段階のことを考えると、何度も使う関数はインライン化した方が速い、という「当り前のこと」に改めて気づきました。 大手金融機関 開発エンジニア殿
株式会社ケイ・ジー・ティーでは、3 次元医用画像処理ソフトウェア「Real INTAGE (リアルインテージ)」の開発にインテル コンパイラーを使用し、インテル 64 対応による高速処理のほかインテル Core 2 Duo プロセッサー上でのプログラムの最適化、およびインテル SIMD 命令の活用による高速ボリュームレンダリングを実現しました。 「インテル® Itanium® システム上では GNU と比べて大幅な高速化が実現し、また、インテル® Xeon(TM) プロセッサー搭載システムで構成されるクラスタシステム上ではスピードと安定性が共に優れていました。」 博士 (理学) 池上努 殿
グリッド研究センター 科学技術基盤チーム 独立行政法人 産業技術総合研究所 「インテル® ソフトウェア開発製品を利用して最適化とマルチスレッド化を行うことで、従来の3.5 倍の処理性能を実現することができました。アプリケーションの高速化を短期間で実現するには、VTune(TM) アナライザーやインテル® コンパイラーなど優れた開発ツールが必要不可欠であるといえます。」 大河内俊雄 殿
ソニーデジタルネットワークアプリケーションズ株式会社 幸い、私の問題の場合には高速な解法が存在することが知られていますが、その他の処理と合わせて、インテルのコンパイラーを用いても 5〜6 時間程度の計算時間が掛かります。また、システムサイズを増やせば、すぐに数日から 1 週間程度の計算時間が必要になります。 しかし、やはりインテルのコンパイラーを用いれば、gcc に比べて格段に実行時間が減らせますので、大変役に立っています。」
国立大学 工学部 情報工学科殿
大手 宇宙情報システム開発 会社殿
有限会社ブロードマインより販売されている TRYCUT2000 の中の機能のひとつである OFFSET 処理機能にインテル C++ コンパイラーを利用した際、アプリケーションの実行速度が 40 % 程向上しました。 「Oracle9i Database から最大限のパフォーマンスを引き出す必要がありました。これがインテル® コンパイラーを選んだ理由です。」 Mark MacDonald 殿
Windows テクノロジー・グループ、Oracle 「GNU C と Linux 版インテル® C++ コンパイラーで当社の標準ベンチマークを実行したところ、インテル® コンパイラーでは最大 37% もパフォーマンスが向上しました。」 Dipankar Choudhury 博士
CTO、Fluent Inc. 「Linux 版インテル® Fortran コンパイラーにより、アプリケーションが 24.5% から 31.5% ほど高速化されました。このパフォーマンスの改善は、われわれのアプリケーションに劇的な変化をもたらしました。」 James Murray 博士
天文学者、システムアドミニストレータ スインバーン大学天体物理学/スーパーコンピューティング・センター これだけコンパイラの性能があれば保守性、可読性を優先した上で、より上位の基本的アルゴリズムの改良による高速化に専念することができます。 元の環境は VisualC++ 2003 Standard です。 (オプションは Standard なため /O2 しか選べません。) その前は VC6.0、CodeWarrior8.0 でもビルドしてましたがこれらは速度的にあまり変わりありませんでした。 使用した インテル C++ コンパイラーのオプションは次の通りです。 Maximize Speed plus High Level Optimization ( /O3 intel ) Global Optimizations: Yes Inline Function Expansion: Any Suitable Enable Intrinsic Functions: No Floating Point Precition Improvement: None Favor Size or Speed: Favor Fast Code Omit Frame Pointers: No Enable Fiber-safe Optimizations: No Optimize For Windows Application: Yes Use Intel® Processor Extensions: PenIII Require Intel Processor Extension: None Loop Unrolling: Parallelization: No 最適化オプションをほとんどオフにしたデバッグ用ビルドの場合、VisualC++ 2003 と Intel C++ コンパイラとの速度差はあまりありませんでした。 今後、どのオプションによってどれだけ速くなるのかは検証する予定です。」
レンダリング開発者殿
|
|
SPEC CPU 2000 ベンチマーク測定結果
- Intel Compiler for Windows と SmartHeap を使用した場合
- Intel Compiler for Linux を使用した場合
※株式会社 日立製作所殿よりご提供いただいた、インテル コンパイラーを使用したベンチマーク情報です。
最新の事例とお客様の声
インテル® VTune Amplifier XE
|
新しいインターフェイスはとても使いやすく、気に入っています。インテル® VTune™ Amplifier XE により、hotspot
の特定と最適化による効果の評価に不可欠な正確かつ詳細なパフォーマンス・データが得られました。
Nik
Software Inc.パフォーマンス・エンジニア
Daniel Schwarz 氏 Open Cascade SAS 社
Sergey Zaritchny 氏 |
インテル® Inspector XE
|
インテル® Inspector XE
の直感的なユーザー・インターフェイスと強力な検出機能により、コード中のメモリー/スレッドエラーをすぐに特定することができ、生産性が向上しました。使いやすいインテル® Inspector XE
は、検出の種類やレベルをカスタマイズでき、メモリーやマルチスレッド・コーディングの不具合をより素早く効率的に発見できて、時間の節約になりました。
Euriware 社 Open Cascade
ソフトウェア開発マネージャー Sergey Zaritchny 氏 OTRADA Inc
CEO、CTO Alex Migdalski 氏 |
導入事例、お客様の声
インテル® VTune パフォーマンス・アナライザー
|
時間がかかるレンダリングの解析に VTune アナライザーを活用 「VTune™ アナライザーはソフトウエア開発者専用のツールのように思われがちですが、システム・インテグレーションの分野においても解析ツールとして十分に活用することができます。」 渡邊周二 殿
コンピテンス・センター テクニカルマネージャ SAP ジャパン株式会社/アライアンス本部 大手ソリューション プロバイダ殿
Abaqus Inc. 殿
「基本的なパフォーマンス・チューニングの作業を完了すると、パフォーマンスが 20〜50% も向上しました。」 Arvind Amin 博士
HPC アプリケーション担当プロジェクト・マネージャ NEC Solutions (America), Inc. Abaqus Inc. 殿
|
導入事例、お客様の声
インテル® クラスター・ツールキット
| 理化学研究所: 「MPI プログラムのチューニングでインテル トレース・アナライザー/コレクターが大変役立ちました。インテル トレース・アナライザー/コレクターで解析したところ、MPI の通信で、ノンブロッキング通信を多数発行しているところで性能が出ていないことが発見でき、これを1対1のブロッキング通信に分割したところ、通信時間は半分程度に高速化されました。 また、インテル トレース・コレクターでプログラムに情報を埋め込むことで、各関数の実行時間やロードバランスを調べることができ、高速化すべきところが容易にわかるようになりました。」
理化学研究所は、物理学、化学、工学、生物学、医科学など幅広い分野にわたり、基礎 研究から応用研究まで多様な研究活動を展開しています。
博士(理学) 古石 貴裕 殿
戎崎計算宇宙物理研究室 独立行政法人 理化学研究所 SDSC: 「通信全体のコストを簡単に特定でき、さらに各 MPI ルーチンで費やされた時間に細分化できます。プロセス数に関係なく、ロード・インバランスの程度と原因も簡単に特定することが可能です。メッセージの統計表示機能は、通信を行っているプロセッサーがグリッド上に表示されて全体を概観できる、特に役立つ機能です。また、シミュレーションの進行に応じて、通信モードで費やされた時間の参照やフォーカスができるのも便利な機能です。」
Dominic Holland 氏
SDSC ソウル市立大学校:「インテル® クラスター・ツールキットを評価し、インテルのソフトウェア・ツールを使用することでインテル® プラットフォーム上でより優れたパフォーマンスを得られるという結論に達しました。インテルのコンパイラーにより、各アプリケーションでこれまでにないパフォーマンスが得られ、また、インテル® クラスター・ツールキットによって、クラスターシステムがどのように実行されているか、そしてどのように改善できるかを理解できました。インテル® クラスター・ツールキットを購入しましたが、これは、新しくインテル® プロセッサー・ベースのクラスターシステムを購入する最も重要な理由の 1 つでした。」
Jinwoo Park 氏
SPCC シニア・システム・マネージャー ソウル市立大学校、韓国 EM Software & Systems:「FEKO 電磁界コードは、さまざまな並列環境 (例: さまざまなサイズのクラスター、共有メモリーマシン) で実行され、並列化が容易ではない複雑な数値アルゴリズムを利用しています。インテル® トレース・アナライザー/コレクターは、FEKO 並列通信パターン、さらにメッセージパッシングの最適化に非常に役立ちました。その結果、ISV 電磁気クラスター・アプリケーションで優れたパフォーマンスを発揮させることができました。」
Ing. Ulrich Jakobus 博士
テクニカル・ディレクター EM Software & Systems TFLOPS の壁を越えることができた
「インテル® ソリューションを利用したことで、大規模クラスターの設計をを行い、ソフトウェアのパフォーマンスを最大限に引き出すことができました。」 The Australian Centre for Advanced Computing and Communications (ac3)
|
最新の事例とお客様の声
インテル® MKL
| 構造解析プログラムでの並列化・高速化事例:千葉大学 野口・柏崎研究室 殿
「高速化前の構造解析プログラムでは、大規模な計算を行うため計算時間がかかるという問題がありました。プログラムを調査したところ、その大部分は行列ソルバーが占めていました。そこで、スカイライン法を用いていたソルバーの部分をインテル® MKL の PARDISO に変更することで高速化を図りました。」 続きは、株式会社計算力学研究センター様のページをご覧ください。 |
導入事例、お客様の声
インテル® MKL
| 「私たちは非線形構造解析プログラムを開発しており、開発環境、エンドユーザー環境としてIntelCPU のマシンを想定しています。それに伴い、コンパイラー、数値計算ライブラリーはインテル社製のものを使わせていただいております。 プログラムの内容は @行列の設定、A境界条件の設定、B行列の求解、C解の更新で、非線形性が強いとこれらを数千回以上繰り返します。計算時間の多くを占めるのはBの部分になります。MKLライブラリを用いることによりここが非常に高速化でき、しかもDual、Quad などのマシンを用いるとおよそ1.5倍、2倍の高速化が実現できました。 この計算性能はハイエンドワークステーションと比較しても2倍くらいで、今まで一昼夜かけて計算していたものが半日で行えることになり、非常に有効です。 またB以外の部分は現在並列化できていないけれど、今後スレッド化手法により並列高速化が可能と思われ取り組んでいく予定です。」 株式会社 計算力学研究センター 荒川 殿
国内大手研究機関殿
「インテル® MKL ルーチンは優れた品質と充実度を誇る NAG ライブラリーを完全に補完する役割を果たします。これらを組み合わせることで、NAG のユーザーは多岐にわたる高性能コンポーネントを利用できるようになっています。」 Brian Ford 博士
常務取締役、NAG Ltd. ESI Computational Structural Mechanics Group 殿
REvolutionComputing 殿
ABAQUS, Inc. 殿
ANSYS, Inc. 殿
|
インテル® IPP
| 「半導体の検査装置で使用しているアプリケーションの開発をおこなっています。インテル IPP 5.3 および インテル C++ コンパイラーを使用しました。結果、飛躍的なパフォーマンスの向上に成功しました。」 大手 メカトロニクス開発エンジニア 殿
国内エンジニアリング会社殿
「良質で高解像度のビデオ映像を個人のデスクで視聴したり、または移動中に鑑賞できる機能が求められています。ImageCom では、このような要望に応えるアプリケーションを提供しています。このアプリケーションの開発には、インテル® インテグレーテッド・パフォーマンス・プリミティブおよびインテル® C++ コンパイラーがその最適化において重要な役割を果たしています。」 Thomas Dove 殿
CEO、ImageCom |
|||||||||||||||||||||||||||||||||||||||||
インテル® TBB
| インテル® TBB の新しいフローグラフ機能を使用することで、これまで不可能だった、数千の相互に関連する非常に大きなタスクグラフを約1
週間で並列化することができました。 Pacific Northwest National Laboratory
GCAM
プロジェクト・サイエンティストRobert Link 氏 「没入型でリアルなゲーム環境の開発をサポートするため、マルチコア PC の能力を活用する必要がありました。インテル® TBB を使用したことで、The Creative Assembly のプログラマーは、提供されるコアの数に応じてスケーリングされるストラテジー・ゲーム用の将来性の高いエンジンを作成し、プロセッサーによる制限から解放されました。以前よりもシステム要件が低くなったにもかかわらず、より大きなアニメー ションが追加されたことで、Napoleon: Total War* が提供するユーザー 体験はよりリアルになり、圧倒的な臨場感を実現しました。」 (Prallel Universe Issue6 Yuri O’Donnell 氏
シニア・エンジン・コーダー、The Creative Assembly 社 |
導入事例、お客様の声
| 分野 | |
| 概要 | |
| 課題 |
|
| 解決方法 |
|
| お客様の声 | 「インテル® Parallel Amplifier により、共通関数が hotspot であることが示されました。その後の調査により、スマートポインターに起因する小さなオーバーヘッドが大量の呼び出しの結果によって相当な時間を要していることがわかりました。このケースは通常のポインターに変更可能だったため、通常のポインターに変えたところ、アルゴリズム全体が最大 10 倍も高速化されました。」 「プロファイリング・ツールを使用しないでこれらのボトルネックを発見することは困難です。インテル® Parallel Amplifier による最適化は簡単でした。関数を 1 度呼び出して記憶し、アルゴリズムの任意の場所で再使用するだけです。」 「Open CASCADE 開発チーム (および弊社の顧客) は、インテル® Parallel Studio によって成し遂げられたパフォーマンスと信頼性の向上を高く評価しています。」 |




