Multi-Sigma 用語集

Multi-Sigma の利用やデータサイエンスの学習に役立つ主要な専門用語を解説します。

データ前処理

欠損値補完
データセット内の空欄 (NaN) を、統計的な手法を用いて適切な値で埋める処理。
再帰的多変量補完
他の変数との相関関係を学習し、欠損値を統計的に「予測」して補完する高度な手法。
スケーリング
単位や桁数が異なる複数の変数を、AI が公平に評価できるように、数値を一定の範囲 (例: 0~1) に変換する処理。
ラグ特徴量
時系列データにおいて、過去のデータを現在のデータと同じ行に含めることで、時間の流れやトレンドを AI に学習させるための特徴量。

ニューラルネットワーク

Epoch (エポック)
AI がデータセット全体を 1 周学習する回数。
Iteration (イテレーション)
Multi-Sigma におけるモデルの「試行回数」。初期値のランダム性に依存しない、より信頼性の高い評価を可能にする。
過学習
AI が学習データを「丸暗記」しすぎてしまい、未知の新しいデータに対して正しく予測できなくなる現象。
正則化
過学習を防ぐための技術の総称。Dropout や Batch Normalization などが含まれる。
Dropout (ドロップアウト)
学習の際に、AI の一部の神経回路を意図的に無視することで、特定のパターンへの過度な依存を防ぐ手法。
Early Stopping
学習の進捗を監視し、精度が改善しなくなった時点で自動的に学習を打ち切る機能。
活性化関数
AI の最終的な出力の「形式」を決定する関数。回帰問題では Linear、2 値分類問題では Sigmoid などが用いられる。
アンサンブル学習
複数の AI モデルの予測結果を組み合わせることで、単一のモデルよりも安定的で信頼性の高い予測を得る手法。

評価指標

RMSE (二乗平均平方根誤差)
Root Mean Squared Error (二乗平均平方根誤差) の略。予測値と実測値の誤差の大きさを示す代表的な指標で、値が小さいほど高精度。
Correlation (相関係数)
予測値と実測値がどれだけ連動しているかを示す指標。1 に近いほど精度が高い。
Relative Error (相対誤差)
予測誤差を実測値で割ることで、値のスケールに影響されにくい誤差率を評価する指標。
ROC 曲線 / AUC
2 値分類モデルの性能を評価するための指標。AUC が 1 に近いほど優れたモデルと判断される。

ガウス過程回帰とベイズ最適化

ガウス過程回帰 (GPR)
データ数が少ない (スモールデータ) 場合に特に有効な機械学習手法。予測値と同時にその予測の「不確実性」も出力できる。
カーネル関数
GPR において、データ同士の「似ている度合い」を測るための物差し。物理現象の特性に合わせて選択することで予測精度が向上する。
ベイズ最適化
GPR が出力する「不確実性」を利用し、次にどの実験を行えば最も効率的に最適解に近づけるかを提案する技術。
獲得関数
ベイズ最適化において、次の探索点を決めるための方針 (EI: 期待改善量、PI: 改善確率など)。
モンテカルロシミュレーション
AI が学習したモデルを基に、仮想的な実験データを大量に生成し、システム全体の挙動を把握する機能。

最適化と遺伝的アルゴリズム

逆解析 (最適化)
「望ましい結果」から、それを実現するための「最適な条件」を導き出す解析手法。
多目的遺伝的アルゴリズム (MOGA)
強度とコストなど、複数の相反する目標 (トレードオフ) を同時に最適化するためのアルゴリズム。
パレート解
MOGA によって得られる、トレードオフの関係にある最適解の「集合」。唯一の正解ではなく、バランスの取れた複数の選択肢を示す。
制約条件
「成分の合計が 100% になる」など、AI が探索する解に現実的な制約を与えるための条件。

連鎖解析

連鎖解析
複数の工程が連なる複雑なプロセスにおいて、各工程の AI モデルを接続し、プロセス全体を一つのワークフローとしてシミュレーション・最適化する機能。

説明可能AI (XAI)

要因分析
AI の予測結果に対して、どの入力変数がどの程度、どのように影響を与えたか (寄与度) を可視化する機能。AI の判断根拠を理解するために用いられる。

より詳しい解説はこちら

各用語の背景や具体的な利用シーンについては、AI 解析入門ページをご覧ください。

AI 解析入門ページへ