インテル® インテグレーテッド・パフォーマンス・プリミティブ 8.2 ユーザーズガイド
いくつかの信号処理ドメイン関数は、インテル® Core™2 プロセッサー・ファミリーでは 2 つのスレッドにスレッド化され、マージド L2 キャッシュを活用します。これらの関数 (単精度および倍精度 FFT、Div、Sqrt) は、2 つのスレッドが同じダイ上で実行された場合にパフォーマンスが最大になります。 この場合、スレッドは同じ共有 L2 キャッシュ上で動作します。ダイに 2 つのコアが搭載されているプロセッサーでは、この条件は自動的に満たされます。2 つを超えるコアが搭載されているプロセッサーでは、パフォーマンスの低下を回避するために次の OpenMP* 環境変数を設定してください。
KMP_AFFINITY=compact
インテル® コンパイラーは、互換マイクロプロセッサー向けには、インテル製マイクロプロセッサー向けと同等レベルの最適化が行われない可能性があります。これには、インテル® ストリーミング SIMD 拡張命令 2 (インテル® SSE2)、インテル® ストリーミング SIMD 拡張命令 3 (インテル® SSE3)、ストリーミング SIMD 拡張命令 3 補足命令 (SSSE3) 命令セットに関連する最適化およびその他の最適化が含まれます。インテルでは、インテル製ではないマイクロプロセッサーに対して、最適化の提供、機能、効果を保証していません。本製品のマイクロプロセッサー固有の最適化は、インテル製マイクロプロセッサーでの使用を目的としています。インテル® マイクロアーキテクチャーに非固有の特定の最適化は、インテル製マイクロプロセッサー向けに予約されています。この注意事項の適用対象である特定の命令セットの詳細は、該当する製品のユーザー・リファレンス・ガイドを参照してください。 改訂 #20110804 |