【julia】統計解析(カイ二乗検定)
2020年4月8日
juliaでカイ二乗検定をしてみます。統計と数学の好き/嫌いのクロス集計表(数値は適当)を作り、独立性の検定をしてみます。
using Gadfly, DataFrames, DataFramesMeta, Statistics, HypothesisTests, Cairo, Fontconfig # 仮想データの作成 dat = DataFrame(["好き" "好き" 14; "好き" "嫌い" 14; "嫌い" "好き" 12; "嫌い" "嫌い" 20]) rename!(dat, [:stat, :math, :val]) # 2x2分割表 # 2x2 で4通りの組合せの合計、合計値のカラム名は count # ベクトルのまま cnt = by(dat, [:stat, :math], count = :val => sum) # カイ二乗検定 # reshape でデータを行列の形にして引数に渡す ret = ChisqTest(reshape(cnt[:, :count], 2, 2)) # プロット Gadfly.plot(dat, xgroup=:stat, x=:math, y=:val, color=:math, Scale.color_discrete_manual("green", "blue"), Scale.y_continuous(minvalue = 0), Guide.ylabel("度数"), Guide.title("統計学と数学の好き嫌いの関係"), Geom.subplot_grid(Geom.bar()))
こちらのサイト「Julia でふつうの統計解析」を参考にさせていただきました。