在TG冲浪的时候看到的一篇好文章,题目是 What Educated Citizens Should Know About Statistics and Probability
。借用蛋挞报频道的文案:
作者在文中总结了七个常见误区,并且通过具体实例来说明为什么这些知识和我们的生活息息相关。
读完后会发现,作者喊话的对象是那些负责在课堂教授基础统计课程的教师们,而喊话的目的在于推动统计教育的变革。
尽管如此,我认为这篇文章写得非常好,适合推荐给所有渴望提升自己的读者。
本博客文章结合了小熊自己的理解,把文章的大意进行提炼。我的英语水平有限,若有错误请谅解也请赐教。
先放上原文链接:https://www.ics.uci.edu/~jutts/AmerStat2003.pdf
1. Cause and Effect
有的时候我们认为,在自变量和因变量有统计学相关性的时候,自变量的变化会引起因变量的变化。
但是事实上,这种变化只在非常受限的情况下适用,例如在大型随机实验的情况下。对于单一的观察性研究,很难得出一个变量引起另一个变量变化的结论。
作者建议在给学生的教授过程中,有必要提供很多样例来讲解交织在一起的变量是如何解释这类关系的。
2. Statistical Significance & Practical Importance
学生们应该知道在统计学意义上的重要发现不一定会对实践产生实际的意义。尤其是在样本量很大的时候,更可能成为一个问题。因为只要存在一个很小的影响(范例)即可拒绝无效假设。
在进行研究时,如果研究人员没有对多重(多变量)比较进行调整,只把注意力集中在统计学意义的关系上,就像这些关系是唯一被测试的关系,就会引起误解。
3. Low Power vs. No Effect
让学生们理解样本量在某种关系或差异是否具有统计学意义方面起着很大的作用,”无明显差异”的结论可能仅仅意味着研究的样本量不足。
特别的,在研究人员预期研究两个变量之间应该有关联但是事实上没有的情况下,学生们更应该小心了。
只有当这一结论与先前的结论或常识相矛盾时,才有新闻价值。
在这种情况下,重要的是找出样本的大小,如果可能的话,找出结果的置信区间。如果置信区间很宽,或者它倾向于偏向偶然性的一方,就有理由怀疑该研究可能没有足够的样本容量来验证多个变量之间真正的差异或关系。
4. Biases in Surveys
在进行问卷调查的时候,不同的问题措辞甚至问题顺序都有可能导致问卷结果的不同。作者将其成为问卷中的「偏见」。
作者提到,不仅仅是问卷中问题的措辞会导致偏见的产生。还有许多关于如何进行问卷调查的其他小细节也有可能会对结果产生重大影响。
主要原因可能是受访者会自然地认为,调查中的问题应该是相互关联的,一个问题所带来的思考都可能影响后续的回答。
5. Probable Coincidences
作者强调了小概率巧合事件在样本较大的情况下仍然有可观的发生的可能性。虽然要计算出精确的巧合概率并不容易,但在教学过程中可以向学生展示近似数量级的计算结果。
文章中举例称即使用一个概率极低的实践,但是世界上有60多亿人(小熊注:现在是70多亿了),每个人每天都有很多情况发生。因此,肯定会有一些看起来很巧合的事情。
例如如果某件事在某一天发生在任何一个人身上的概率只有百万分之一,那么平均来说,它每天会发生在世界6000多人身上。所以在我们看到媒体报道一个令人难以置信的巧合时,应该从这个角度来思考。
6. Confusion of The Inverse (Conditional Probability)
在这个问题之中,作者认为人们很容易就会将条件概率P(A|B)与条件概率P(B|A)混淆。
我们要着重思考事情的因果和概率问题。
7. Average vs. Normal
学生应当了解自然变异性(小熊注:原文为 natural variability,不知道怎么翻译合适)及其在解释”正态分布”上起到的作用。
不要将正态分布与平均值混淆。这种混淆的错误在温度和降雨量数据和其他情况下非常常见。自然变异性的概念对于理解统计结果非常关键,因此应该在整个统计学入门课程中强化这一概念。
总结
这篇文章在总结部分重申如果一个学生不能在阅读一篇报道后发现确定假设检验被误用,那么在课程中学习如何进行t验证又有什么用呢?
作者会经常问博士学生两个问题:1. 解释p值的含义。2. 如果在用一个更小的实验样本重新验证一个具有重要发现的实验,但是不能复现结果的时候能否给出可能的合理解释。
如果本篇文章引起了你对常见统计学和概率论误解的探索兴趣,可以去查看英文原文,欢迎一起交流学习。