外れ値検出ツール

1.5=標準、3.0=極端な外れ値のみ
2.0=標準、3.0=厳格
結果をシェア:

外れ値検出とは?

外れ値(アウトライア)は、他のデータから大きく外れた異常な値のことです。データ分析や品質管理では、外れ値を検出して除外・調査することで、正確な分析結果を得られます。

検出方法

四分位範囲法(IQR法)

データを4等分し、第1四分位(Q1)と第3四分位(Q3)の差(IQR = Q3 - Q1)を使います。

外れ値 = Q1 - 1.5×IQR より小さい、または Q3 + 1.5×IQR より大きい値

分布の形に依存しないため、最も汎用的な方法です。

Zスコア法

各データが平均からどれだけ離れているかを標準偏差の倍数で表します。

Zスコア = (値 - 平均) / 標準偏差

|Zスコア| > 2(または3)のデータを外れ値とします。正規分布に近いデータに適しています。

倍率・閾値の選び方

設定IQR倍率Zスコア特徴
緩め1.52.0広く検出。探索的分析向き
標準1.52.5一般的な設定
厳格3.03.0極端な外れ値のみ検出

よくある質問

自動的に削除するのはNGです。まず原因を調査してください。入力ミスなら修正・削除、実際の異常値なら分析目的に応じて判断します。外れ値が重要な発見につながることもあります。
いいえ、すべての処理はブラウザ上で完結します。データが外部に送信されることはありません。