マハラノビス距離とは何か――共分散行列から考える

マハラノビス距離は、ただの「遠さ」ではない。 共分散行列を使って、データの散らばり方まで織り込んだ“自然な距離”を作る考え方。 結論 マハラノビス距離は、共分散行列で座標を補正した距離。 ユークリッド距離は「全部の方向を … 続きを読む

主成分分析はなぜ共分散行列の固有値問題になるのか

主成分分析は、たくさんの変数を“少ない軸”にまとめ直す方法。 その軸は気分で決めるのではなく、共分散行列が持っている「ばらつきの向き」から決まる。 結論 主成分分析は、共分散行列の“固有ベクトル”で軸を取り直すこと。 主 … 続きを読む

分散・共分散・共分散行列を、平均からのズレで理解する

分散は「1つの変数がどれくらい散らばっているか」。 共分散は「2つの変数が一緒にどう動くか」。 共分散行列は、その関係をまとめて持つ“データの形の地図”。 結論 3つは別物ではなく、同じ枠の中でつながっている。 分散は、 … 続きを読む