本站原创文章,转载请说明来自《老饼讲解-机器学习》www.bbbdata.com
本文简单介绍卡方检验是什么,用来干什么,工作原理的思路,
通过本文初步了解卡方检验是个什么东东。
卡方检验分为独立性检验和拟合性检验,各自解决的问题不同。
拟合性检验
拟合性检验解决的问题
一个单变量,有n组,检验各组别的取值是否有显著区别。
例子
小明的的成绩,语文、数学、英语分别是60、70、80分。
问小明的各科成绩是否有显著差异。
独立性检验
独立性检验解决的的问题
一个变量(类别分布),有n组,检验组别对类别分布是否有区别。
例子
检验男女两组在身高分布上有没有区别。
简单总结
总的来说,
拟合性检验的是各组别的值有没有区别,
而独立性检验则是检验各组别的分布有没有区别。
1.计算没有区别时每个值的期望值
2.计算期望值与事实值的差异(构造成符合卡方分布的)
3.计算差异发生的概率,如果是小概率,则说明差异显著,组别间存在区别
End