Location : Home > Languages > Perl > Package Title : Statistics::Table::F |
![]() |
Statistics::Table::F - F-ratio の計算
use Statistics::Table::F; if (($F = anova($list_of_lists)) >= F(@$list_of_lists - 1, count_elements($list_of_lists - @$list_of_lists), 0.05)) { print "F is $F; the difference between your data sets is significant.\n"; } else { print "F is $F; the difference between your data sets is not significant.\n"; }
"Mastering Algorithms in Perl"(Orwant, Hietaniemi, and Macdonald ; O'Reilly 1999)の15章以降を見よ。
分散分析(ANOVA)は、1データセットにおける分散ではなく、データセット間の分散を比較した場合に必要な分析手法である。個々のサンプルの平均及び分散について話を進めたい。
さて、ここで抽象化のレベルを上げてデータセットをさらに大きなデータセットの要素とみなした全体−データセットのデータセット−について考えよう。
ウェブデザインのテストにおいては、帰無仮説は「デザインは平均的なサイズにまったく影響を与えない」である。対立仮説は「あるデザインは他のものと異なる」である。これはさほど強い命題ではない。各デザインの比較を示すには小さいマトリクスで済めばよいが残念なことに ANOVA ではこれができない。
私たちが特にここで検討している分散分析、すなわち一元配置分散分析(one-way ANOVA)の鍵は F-ratio を求めることである。F-ratio は各データセットの平均の分散を 分散の推定値の平均で除したものとして定義される。これは今までで見た中で最も複雑な信頼度検定である。ここに全ての4つのデザインの分散分析を計算する Perl プログラムがある。
ANOVA は様々な要素数の複数のデータセットに対する分析に有効であるため、$designs(リストのリスト)でそれらの データ構造を反映できることに留意せよ。
Jon Orwant, orwant@media.mit.edu
Statistics::ChiSquare, Statistics::Table::t
![]() |
Updated : 2007/08/31 |