この記事はインテル コーポレーション スーパーコンピューティング・グループのプリンシパル・エンジニア Vikram Saletore 博士の代理として投稿しています。
HPC インフラ上で動作する機械学習や深層学習の AI フレームワークやモデルの急速な開発と利用に支えられた大量のデータの利用により、人工知能 (AI)、ハイパフォーマンス・コンピューティング (HPC)、高性能データ解析 (HPDA) の融合が起こっています。この融合は、科学的コンピューティングの展望を再構築し始め、科学者が以前には不可能であったユニークな方法で解決策を見出すことを可能にしました。
インテルでは、人工ニューラル・ネットワーク (ANN) は、モデリングとシミュレーションのパイプライン全体にわたってアクセラレーターとして機能すると考えています。エンドユーザー・イネーブルメント・チームの一員である私の仕事は、科学のための HPC と AI における多くの進行中の進歩を、エンドユーザーのアプリケーションと研究に結び付けることに重点を置いています。科学者がモデリングやシミュレーションにおける AI に懐疑的なのは当然であり、私たちは多方面からアプローチしています。AI テクノロジーが有用であるためには、ユーザーのシミュレーションに非物理的な人工物を持ち込まないように、実証的に正しい結果を提供し、推論の高速化、移植性、使いやすさなど、何らかの利益を提供する必要があります。
科学者たちは、モデリングやシミュレーションにおける AI に対して当然ながら懐疑的です。AI テクノロジーが有用であるためには、ユーザーのシミュレーションに非物理的な人工物を持ち込まないように、実証的に正しい結果を提供し、推論の高速化、移植性、使いやすさなど何らかの利点を提供する必要があります。
実用的な解決策を多数用意
私たちのお客様は、HPC や産業界における AI テクノロジーの新しい、より良い使い方を常に見出しており、実用的なソリューションが豊富にあることを実証しています。製造業の欠陥密度低減、小売業への支援、デジタルツイン設計による堅牢で静かな燃費の良いジェットエンジンの開発、製造現場への AI 導入、スマートシティー実現への取り組み、交通流解析、自動車衝突シミュレーションによる救命、ハイコンテンツ創薬、航空機整備・修理支援、計算流体などの分野での一般化、高エネルギー粒子検出器の設計による人類の知識の発展など、多くの進展があるので簡単に列挙することはできませんが、その中で、最も重要なのは、「スマートな都市」です。数多くの成功事例により、農業や健康など様々な分野の問題を解決するために、世界中のデータセンターでプロダクション AI 推論モデルが展開されています。
どのような場合でも、物理的・生物学的なシステムが、代用 AI モデルと既存のシミュレーションやグランドトゥルース・データを確実に一致させるための「説明可能な AI」が必要だと思います。
説明可能な AI は、AI ベースの洞察を解釈し、説明し、検証できる人間の専門家をループに組み込んでいます。例えば、腫瘍を特定する可能性のある CT スキャンの推論を解釈する場合、説明可能な AI には放射線科医が組み込まれており、専門家の解釈を用いて、特定された領域が実際に腫瘍であることを確認します。これは、研究努力と AI/HPC/HPDA の融合が私たちの生活をどのように変えるかを強調する簡単な例です。
AI が科学研究に与える影響
AI テクノロジーは、将来の研究のほぼすべての側面に影響を与えるでしょう。成功例や先端技術をすぐに利用できるようになったことで、AI による増強や代替が、コンピューター・モデルでできることをいかに拡大できるかについて、科学者の間で認識が高まっています。このことは、科学者がより正確なモデルや説明可能な AI モデルの作成を追求する中で、新しい考え方や大きく考える自由を促進します。科学者たちは、以前は不可能だった研究ができることを実感しています。
成功例や先端技術へのアクセスが容易になったことで、AI による拡張や代替が、コンピューター・モデルでできることをいかに拡大するかについて、科学者の間で認識が高まっています。このことは、科学者がより正確なモデルや説明可能な AI モデルの作成を追求する中で、新しい考え方や大きく考える自由を促進します。科学者たちは、以前は不可能だった研究ができることを実感しています。
データ・サイエンティストは、物理的制約を AI モデルに組み込んで、PINN (Physics Informed Neural Networks) (英語) と呼ばれるものを作成し始めています。これらの制約により、ニューラル・ネットワークの作成、トレーニング、および展開が高速化されます。学習中、ANN は与えられた学習セットに対して最適なモデルを作成するように最適化されます。「最適」なモデルは、物理を最も正確に反映した結果をもたらします。物理的な現実に関する情報を追加することで、PINN はより正確で予測可能なモデルを作成し、より速く訓練することができます (解答までの時間)。
PINN は、科学者が実世界の問題に対処するために使用している多くの新しい AI アプローチの 1 つを反映しています。天気予報のパイプラインは、これらの新しいアプローチが、入力データの前処理から同化、予測、後処理、評価まで、HPC ワークフローのあらゆる側面に影響を与えることを示す具体例の 1 つです。これらの新しいアプローチにより、天気予報のための、より高速でより正確なモデルが実現すれば、社会は恩恵を受けます。
新しい AI のアプローチは、科学者が手持ちのデータでより多くのことができるようになることを意味します。一方、世界中の科学者は間もなく、最新のインテル AI アクセラレーターの並外れた性能にアクセスできるようになります。新しいテクノロジーへのアクセスにより、世界中の科学者がより大きなデータセットに対応し、発見までの時間を短縮することが可能になります。
新しい AI のアプローチは、科学者が手持ちのデータでより多くのことができるようになることを意味します。新しいテクノロジーにアクセスすることで、世界中の科学者がより大きなデータセットに対応し、発見までの時間を短縮することができます。
重要な課題は「バリデーション」
解決までの時間を短縮するテクノロジーは不可欠ですが、データから派生するモデルの究極の課題は検証です。つまり、AI を使った取り組みでは、「ニューラル・ネットワークが思った通りに動いていることをどうやって確認するのか?」という質問に答える必要があるのです。
ニューラル・ネットワークが、私たちが考えているとおりに動いていることを、どうやって知ることができるのでしょうか?
この質問に答えることは、データサイエンスと取り組んでいる問題について深く慎重に考える必要がある課題です。多くの組織にとって、AI テクノロジーと専門知識の採用は非常に新しいものです。インテルのエンドユーザー・イネーブルメント・チームは、企業がテクノロジーの採用曲線に沿って進みながらニーズを理解し、インサイトに至るまでの時間を短縮できるよう、支援に取り組んでいます。これには、適切なテクノロジー・アプローチとテクノロジー・ビルディング・ブロックを選択することが含まれます。
多くの組織にとって、AI テクノロジーと専門知識の採用は非常に新しいものです。インテルのエンドユーザー・イネーブルメント・チームは、企業がテクノロジーの導入曲線に沿って進みながらニーズを理解し、インサイトへの時間を加速できるよう支援しています。
AI と HPC リソースのアジャイルな活用に火をつける
HPC と AI のワークロードの間には、その大きな計算要件に動機付けられた収束があります。これは、多くの AI エンドユーザーが、HPC ワークロードをサポートするために設計された既存のクラウドやデータセンターで実行することを選択する理由を説明しています。HPC と AI の両方のエンドユーザーは、ワークロードのスケールアップとスケールアウトを必要としています。
しかし、違いはあります。私たちインテルは、AI のお客様や HPC コミュニティーの声に注意深く耳を傾けてきました。当社のエンジニアリング・チームは、製品スタック全体を通して、顧客から要求されたソリューションを提供するために、素晴らしい努力をしています。これは、高帯域幅、低レイテンシー、大容量メモリーおよびストレージシステムを組み込んだデバイスに、AI に特化した命令を追加する新しい命令セット・アーキテクチャー (ISA) に見ることができます。これらの先進的なインテル・テクノロジー・デバイスの多くは、今年中にお客様の手元に届くことでしょう。(英語)
試作機は素晴らしいパフォーマンスを発揮しています。早くお客様のお手元に届けたいですね。なぜ私たちがこれほどまでに興奮しているのか、その理由を知るには、アーキテクチャー・デイ (英語) をご覧ください。例としては、以下のようなものがあります。
- XPU は、高帯域幅のメモリーを組み込んだ AI 対応の汎用ハードウェア・プラットフォームを提供します。「XPU」の「X」は、アプリケーションのニーズに最適な任意のコンピュート・アーキテクチャーを意味します。
- Xe-HPC アクセラレーター (開発コード名: Ponte Vecchio) は、広帯域のメモリーとインターコネクトを組み合わせた大規模な並列処理を提供します。これらはすべて、分散 HPC 環境において解決までの時間を短縮するために重要なものです。
- 次世代インテル® Xeon® スケーラブル・プロセッサー (開発コード名: Sapphire Rapids) は、AMX (Advanced Matrix Extensions) および TMUL (Tile matrix MULtiply) の ISA 拡張を含む AI 用の新しい命令を搭載したアーキテクチャーになっています。また、これらのインテル® プロセッサーの一部には、HBM (High Bandwidth Memory) が組み込まれています。
- インテル® Optane™ パーシステント・メモリーと分散非同期オブジェクト・ストレージ (DAOS) は、データ処理の問題を解決するためにストレージの性能を革新しました。
オープン性、パフォーマンス、そしてアプリケーションを大規模に実行する能力を備えたソフトウェア戦略
ソフトウェアは、ポータブルなヘテロジニアス・コンピューティングを可能にし、まだ実現されていないハードウェアのイノベーションへのゲートウェイとなるものです。適切なソフトウェアを使用することで、エンドユーザーはクラウド上で自由を得ることができ、好みのハードウェアを使用することができるようになります。HPC と AI テクノロジーの変化の速度は今後も続くと予想されます。科学者やアプリケーション開発者は、エクサスケール・スーパー・コンピューティング時代やその先のコンピューティング・プラットフォームの進化に対応できるよう、適切なソフトウェアを選択することが必要です。
適切なソフトウェアを使用することで、エンドユーザーはクラウド上で自由に、好きなハードウェアを使用することができます。
oneAPI イニシアチブは、科学者が HPC と AI のパフォーマンスの壮大な新しい展望を開くために必要なソフトウェアの俊敏性を提供します。oneAPI ソフトウェア・エコシステムは、パフォーマンスと移植性の両方を提供し、多数のタスクに対応する最新テクノロジーをサポートします。インテル® oneAPI コンパイラーとライブラリーは、アプリケーションをハードウェア・ロックインから解放するため、科学者や組織は、CPU ベースであれハードウェア・アクセラレーションであれ、最も高速でコスト効率の高いハードウェア・プラットフォームで実行するために迅速にピボットすることができます。
私のグループは、oneAPI と、ハードウェアのロックインを回避するためにソフトウェア・エコシステムがどのように顧客のニーズに対応するかを教えています。私たちは、すぐに使える並外れたパフォーマンスを求める顧客の期待に応えつつ、時間をかけてパフォーマンスを調整し向上させるためのインテル® oneAPI ツールや専門知識を提供しています。さらに、科学者がビッグ・ワークロードのデータをフォトリアリスティックに視覚化するためのライブラリーも提供しています。