SciPy は Python のための科学的ツールのオープンソース・ライブラリとして開発されています。SciPyは、NumPy をベースにしていて、統計、最適化、積分、線形代数、フーリエ変換、信号・イメージ処理、遺伝的アルゴリズム、ODE (常微分方程式) ソルバ、特殊関数、その他のモジュールを提供しています。
Wikipedia より引用、編集
データの集合が正規分布とみなせるかの検定を Python でできるようにする必要があったので、参考サイト [1] を参考にして、Shapiro-Wilk および Anderson-Darling の正規性検定のサンプルを作ってみました。
normality_test.py
以下に実行例を示しました。
[24.61705496 19.56390871 19.13798944 17.16842011 12.8670519 21.24411178 24.89046892 16.53493345 20.54015744 22.8150989 15.60100487 24.40446872 ... ... 19.64959102 14.48918507 22.90403538 18.97650011 23.17654791 21.12734951 9.98367097 16.94422025 29.93326303 24.63846928 19.07507917 10.12488745] > Shapiro-Wilk test stat = 0.986, p-value = 0.137 Probably Gaussian at 5% level of significance > Anderson-Darling test stat = 0.463 Probably Gaussian : 0.562 critical at 15% level of significance Probably Gaussian : 0.640 critical at 10% level of significance Probably Gaussian : 0.767 critical at 5% level of significance Probably Gaussian : 0.895 critical at 2% level of significance Probably Gaussian : 1.065 critical at 1% level of significance
次は GUI を利用して、Q-Q プロットやヒストグラムと一緒にしたサンプルを作成したいと考えています。
参考サイト
- 10 Normality Tests-Python (2020) | Towards Data Science [2020-09-18]
- scipy.stats.shapiro — SciPy v1.6.2 Reference Guide
- scipy.stats.anderson — SciPy v1.6.2 Reference Guide
にほんブログ村
0 件のコメント:
コメントを投稿