S.R.D.C.たのしいよ!(ダイマ)
はい。かわさき班所属のしんちょく( @sintyoku_count )です。
突然ですが、自分のよく使う3Dプリンタはデータでφ3の穴を印刷すると、φ2.8くらいになる感覚があります。
直径に比べて0.2mm小さくなる。
はたしてこの感覚はただしいのか、調べてみましょう。
まず、確かめるには仮説が必要です。
以下の通り仮説を定めてみます。
直径:D=3mm
収縮量:ε=0.2mm
平均直径:μ
{H0:μ=D-ε,H1:μ≠D-ε}
(勘のいい方なら帰無仮説の設定でオチがわかってしまいそうですが、気にしない)
以上を穴のサンプル数20でt検定します。
無作為な座標で右のような試験片を造形しました。
この中から穴を20個無作為に選びます。
ランダムサンプリング大切。
今回は妥当性をt検定で検定するわけですが、検定の詳細な仕組みは調べればいくらでも参考資料が出てくると思いますので省きます。
Student化した変数Tを導入して、もろもろ計算した結果
T≒2.573
と求まりました。
ます。
さて、優位水準α=0.05とした時の自由度19(自由度はサンプル数-1で定まる)のt-分布の両側検定での棄却域は2.093です。つまり、-2.093~+2.093の区間に入っていなければ帰無仮説が適当ではないといえるようになります。
明らかに2.573は大きいですね。
両側検定で棄却できましたので、めでたく私の感覚が正しくないと言えてしまいました!
ナンテコッタイ
え?
「レポートの参考にしようと思ったのに(゚д゚#)」
「計算過程がないじゃないか(-_-メ)」
ですって?許してください……。
代わりに何を言わんとしているのか書きます。
十分な回数行ったうえで発生した偶発的な出来事は大半が正規分布に沿った確率で現れます。しかし試行回数が少ない場合、差分が出てしまいます。そこで、少ない回数の試行が従う確率分布を考えてやる必要があり、これがt-分布と呼ばれるものです。もちろん、t-分布の試行回数を増やし続ければ正規分布に近づきます。
t-検定はその性質を利用したものです。
今回の検定は直径の平均値μ=D-ε=2-0.2=1.8(mm)が正しいと仮定したときの分布を考えて、その分布の下で実際の結果はどのくらいの確率で起こるのかを考えたものです。
結果は、5%以下の確率で起こる出来事であるとわかりました。初手で5%以下の出来事が起こってしまった以上、仮定した平均値μ=1.8が間違えてると考えたほうがよさげであると考えて、μ=1.8は正しくないと言える(棄却する)訳です。
では、もし万が一5%以上の確率で起こるような値が出た場合はどうでしょうか、これは何も言えません。μ=1.8としたいところですが、例えばμ=1.9とした方が確率的に高いかもしれません。すなわち、この結果だけでは当然μ=1.8とするのが最も適しているとも言えず、結局何も言えないのです。
棄却できたことで初めて意味のある結論を導けるので、”めでたく”は何も間違っていないのです。
コラム:謎の数式の読み方
{H0:μ=D-ε,H1:μ≠D-ε}
上記の式は、仮説の項にさらっと書いてありましたが、そんなのわかるか!という声をいただきそうなので、軽い解説をば……。H0とH1はそれぞれ帰無仮説と対立仮説のことです。帰無仮説の名の通り「仮にこう考えてみたけれど、多分違うんだろなー」みたいな条件です。で、ちょっと面倒な式を解いて、検定を行うわけです。めでたく帰無仮説が適さないという判定が出たら、「やっぱり帰無仮説違ったかーやっぱりなー」とか言いながら対立仮説を適するものとして扱うわけです。論じ方は背理法にそっくりですね。
帰無仮説をμ=D-εとしているので、はなから平均値としてD-ε=2.8は妥当ではないと考えているわけですね。
おそらく読者の中には「逆にデータからある優位水準で適すると考えられる直径を求めることができるんじゃね?」みたいなことを考えている方もいらっしゃると思います。
ええ。きちんとありますとも。区間推定と呼ばれます。この場合は「??%の確率でこの数値の範囲に入っている。」という結論になります。
基本的な考え方は同じですので、余力のあるかたは本やインターネットで区間推定を調べてみてください。
間違い等見つけましたら、こっそり教えてください。
著者twitter : https://twitter.com/sintyoku_count
Comentários