【julia】ある事象のカイ二乗検定

ある事象がポアソン分布に従っているかどうかをカイ二乗検定にて確認します。統計検定2級2014年11月の問6の問題を解いてみます。Rで行ったこちらをjuliaで実行してみました。

ある地域における1日の死亡者数の集計結果(500日間)の表があります。これがポアソン分布に従っているか調べます。

死亡者数(人)0123456人以上
件数(日数)551441409545159500

#using Pkg
#Pkg.add("StatsPlots")
#Pkg.add("HypothesisTests")
#Pkg.add("LinearAlgebra")
using StatsPlots
using HypothesisTests
using LinearAlgebra

Died=[0, 1, 2, 3, 4, 5, 6]
Days=[55, 144, 140, 95, 45, 15, 9]
mu=sum(Died.*Days/500)
d=Poisson(mu)
E_Days=pdf.(d,0:6)*500
E_Days[7]=(1-sum(pdf.(d,0:5)))*500
E_Days

plot(
    bar(Died, Days, xticks=0:10, xlab="Days"),
    bar(Died, E_Days, xticks=0:10, xlab="E_Days"),
    layout=(1,2),  # 1行2列
    link=:y  # y軸を共有
)

ChisqTest(Days,normalize(E_Days,1))

死亡者数の平均値muを計算すると2.0でした(死亡者数が7人以上の日は、なかったとして)。

1日の死亡者数がポアソン分布に従っているか検定します。ポアソン分布は、以下であらわされます。
\(f(x)=\frac{e^{-\lambda} \lambda^x}{x!}\)
検定をするために、各死亡者数に対する期待度数を計算します。上式に、\(\lambda=2.0\)を入れて、各死亡者数xに対する期待度数を計算します。その結果が、下の表です。また、実測の度数と期待度数のヒストグラムは次の通りです。

死亡者数(人)0123456人以上
件数(日数)67.7135.3135.390.245.118.08.3500

なんとなく似ていますね。実際の検定は、\(ChisqTest()\)で行います。適合度の検定となります。結果は次の通りです。
julia:

Pearson's Chi-square Test ------------------------- Population details: parameter of interest: Multinomial Probabilities value under h_0: [0.1305498673399876, 0.26579952990421485, 0.2705839214424907, 0.18363628801897036, 0.09347087060165594, 0.03806133850899433, 0.017898184183686158] point estimate: [0.10934393638170974, 0.28628230616302186, 0.2783300198807157, 0.18886679920477137, 0.08946322067594434, 0.02982107355864811, 0.017892644135188866] 95% confidence interval: Tuple{Float64,Float64}[(0.0656, 0.1556), (0.2425, 0.3325), (0.2346, 0.3245), (0.1451, 0.2351), (0.0457, 0.1357), (0.0, 0.076), (0.0, 0.0641)] 

Test summary: outcome with 95% confidence: fail to reject h_0 one-sided p-value: 0.7176 

Details: Sample size: 503 statistic: 3.6968473774524364 degrees of freedom: 6 residuals: [-1.3162946562978302, 0.8910369404950074, 0.3339765783839597, 0.27374668897878746, -0.2939920772748435, -0.9472904080784713, -0.0009287376946351219] std. residuals: [-1.4116621784970134, 1.039892342572565, 0.39104644753295276, 0.30297516393283064, -0.30877685892328993, -0.9658494789599426, -0.0009371623130228649]

結果が見にくいですが、帰無仮説を棄却できなかったため、この死亡者数はポアソン分布に従うといえます。


Add a Comment

メールアドレスが公開されることはありません。