【julia】統計解析(カイ二乗検定)

juliaでカイ二乗検定をしてみます。統計と数学の好き/嫌いのクロス集計表(数値は適当)を作り、独立性の検定をしてみます。

using Gadfly, DataFrames, DataFramesMeta, Statistics, HypothesisTests, 
      Cairo, Fontconfig
# 仮想データの作成
dat = DataFrame(["好き" "好き" 14;
                 "好き" "嫌い" 14;
                 "嫌い" "好き" 12;
                 "嫌い" "嫌い" 20])
rename!(dat, [:stat, :math, :val])

# 2x2分割表
# 2x2 で4通りの組合せの合計、合計値のカラム名は count
# ベクトルのまま
cnt = by(dat, [:stat, :math], count = :val => sum)

# カイ二乗検定
# reshape でデータを行列の形にして引数に渡す
ret = ChisqTest(reshape(cnt[:, :count], 2, 2))

# プロット
Gadfly.plot(dat, xgroup=:stat, x=:math, y=:val, color=:math,
        Scale.color_discrete_manual("green", "blue"),
        Scale.y_continuous(minvalue = 0),
        Guide.ylabel("度数"),
        Guide.title("統計学と数学の好き嫌いの関係"),
        Geom.subplot_grid(Geom.bar()))

こちらのサイト「Julia でふつうの統計解析」を参考にさせていただきました。

Add a Comment

メールアドレスが公開されることはありません。