2021-04-21

正規性の検定 (SciPy)

SciPy は Python のための科学的ツールのオープンソース・ライブラリとして開発されています。SciPyは、NumPy をベースにしていて、統計、最適化、積分、線形代数、フーリエ変換、信号・イメージ処理、遺伝的アルゴリズム、ODE (常微分方程式) ソルバ、特殊関数、その他のモジュールを提供しています。

Wikipedia より引用、編集

データの集合が正規分布とみなせるかの検定を Python でできるようにする必要があったので、参考サイト [1] を参考にして、Shapiro-Wilk および Anderson-Darling の正規性検定のサンプルを作ってみました。

normality_test.py

以下に実行例を示しました。

[24.61705496 19.56390871 19.13798944 17.16842011 12.8670519  21.24411178
 24.89046892 16.53493345 20.54015744 22.8150989  15.60100487 24.40446872
 ...
 ...
 19.64959102 14.48918507 22.90403538 18.97650011 23.17654791 21.12734951
  9.98367097 16.94422025 29.93326303 24.63846928 19.07507917 10.12488745]

> Shapiro-Wilk test
stat = 0.986, p-value = 0.137
Probably Gaussian at 5% level of significance

> Anderson-Darling test
stat = 0.463
Probably Gaussian : 0.562 critical at 15% level of significance
Probably Gaussian : 0.640 critical at 10% level of significance
Probably Gaussian : 0.767 critical at  5% level of significance
Probably Gaussian : 0.895 critical at  2% level of significance
Probably Gaussian : 1.065 critical at  1% level of significance

次は GUI を利用して、Q-Q プロットヒストグラムと一緒にしたサンプルを作成したいと考えています。

参考サイト

  1. 10 Normality Tests-Python (2020) | Towards Data Science [2020-09-18]
  2. scipy.stats.shapiro — SciPy v1.6.2 Reference Guide
  3. scipy.stats.anderson — SciPy v1.6.2 Reference Guide

 

ブログランキング・にほんブログ村へ bitWalk's - にほんブログ村 にほんブログ村 IT技術ブログ Linuxへ
にほんブログ村

0 件のコメント: