シャピロ・ウィルク検定|正規性検定ツール

データ数 n=3〜5000 で有効(Royston 1992 AS R94アルゴリズム)。不正な値は自動でスキップします
p値がα未満なら「正規分布に従わない」と判断
結果をシェア:

シャピロ・ウィルク検定(正規性検定)とは

シャピロ・ウィルク検定(Shapiro–Wilk test)は、データが正規分布に従うかを判定する正規性検定の代表的な手法です。論文・卒論・品質管理・データ分析の前処理で、t検定やANOVAなどパラメトリック検定を使う前に「データが正規分布しているか」を確認する目的で広く使われます。

このツールは、データを貼り付けるだけでW統計量とp値を自動計算し、正規分布に従うかを判定します。データはブラウザ内だけで処理され、サーバーに送信されません。

検定の見方

仮説

  • 帰無仮説 H₀:データは正規分布に従う
  • 対立仮説 H₁:データは正規分布に従わない

判定ルール

結果判定意味
p値 ≥ α帰無仮説を棄却しない正規分布に従うと判断してよい
p値 < α帰無仮説を棄却正規分布には従わない

一般的には α = 0.05 を使います。品質管理など厳格な判定では 0.01、探索的分析では 0.10 を使うこともあります。

W統計量

W統計量は 0〜1 の値を取り、1に近いほど正規分布に近いことを示します。Royston (1992) のAS R94アルゴリズムにより、n=3〜5000 の範囲で精度よく計算されます。

使い方の目安

  • データ数 n=3〜5000 で正確に判定できます
  • サンプル数が大きいと、わずかな非正規性でも有意になりやすいので、W統計量の値やヒストグラム・Q-Qプロットと合わせて総合判断を推奨
  • 外れ値がある場合は、外れ値検出ツールで確認してから検定するのがおすすめ
  • Q-Qプロット上で点が直線にどれだけ乗るかも視覚的な手がかりになります

他の正規性検定との違い

検定特徴推奨サンプル数
シャピロ・ウィルク小〜中サンプルで高い検出力。最も広く使われる3〜5000
コルモゴロフ・スミルノフ任意の分布に使えるが正規性検出力は低め大サンプル向き
アンダーソン・ダーリング分布の裾の違いに敏感中〜大サンプル
ジャック・ベラ(Jarque–Bera)歪度と尖度に基づく簡易判定大サンプル向き

正規性が棄却されたら

p値がα未満で正規分布が棄却された場合、以下の対応が考えられます。

  • 対数変換・平方根変換などの変数変換で正規分布に近づける
  • t検定の代わりにノンパラメトリック検定(マン・ホイットニーU検定、ウィルコクソン符号順位検定など)を使う
  • サンプル数が十分大きい場合は、中心極限定理によりt検定・ANOVAは頑健性を持つため、そのまま使える場合もある
  • 外れ値が原因なら、外れ値の精査・除外を検討する

出典・参考資料

本ツールはRoyston (1992) AS R94アルゴリズムによる近似計算を採用しています。n=3〜5000 の範囲で統計ソフト(R の shapiro.test() 等)と同等の精度で計算可能です。学術論文等に使用する場合は、最終的な数値は必ずR・Python(scipy.stats.shapiro)・SPSS等の検証済みソフトで再確認してください。

よくある質問

サンプル数が大きい(数百以上)と、ごくわずかな非正規性でもp値が小さくなり棄却されやすくなります。W統計量が1に近い(0.95以上など)かつヒストグラム・Q-Qプロットで大きな歪みがなければ、実用上は正規分布とみなして問題ないことが多いです。検定結果だけでなく視覚的な確認と合わせて総合判断してください。
本ツールはR・Python・SPSSなどと同じ Royston (1992) AS R94 アルゴリズムを採用しており、n=3〜5000 の範囲で概ね一致した結果が得られます。ただし丸め誤差により末尾の桁で差が出る場合があるため、論文投稿等では最終値を検証済みソフトで再確認することをおすすめします。
いいえ、すべての計算はブラウザ内で完結します。入力データが外部に送信されることは一切ありません。
AS R94 の精度保証範囲は n≤5000 です。それ以上の大サンプルでは、中心極限定理によりt検定・ANOVA等がそもそも頑健になるため、正規性検定自体の必要性が薄れます。ヒストグラム・Q-Qプロットでの視覚的確認や、より適した検定(アンダーソン・ダーリング等)の利用を検討してください。