时代早报

初等的机率论(1)母群体与统计变量(Population a

摘要:这一系列「初等的机率论」文章共有十篇,本文是第一篇,先从「记述统计学(Descriptive Statistics)」的角度出发,介绍母群体与统计变量的关係。世界上到处都可以见到随机现象(random phenomena),所谓随机现象是指事先说不準会发生什幺结果(outcome)的现象。机率

时代早报2020.06.19

摘要:这一系列「初等的机率论」文章共有十篇,本文是第一篇,先从「记述统计学(Descriptive Statistics)」的角度出发,介绍母群体与统计变量的关係。

世界上到处都可以见到随机现象(random phenomena),所谓随机现象是指事先说不準会发生什幺结果(outcome)的现象。机率论(Probability theory)就是要定量地来研究随机现象的一门数学。机率论最早发源于赌局(game of chance),赌徒想要知道输赢的机率,以及有无必胜法。

机率论的另一个发源地是记述统计学(Descriptive Statistics, 又译成叙述统计学)。了解记述统计学的概念,对于机率论的学习,大有助益,因为前者是具体的,易懂的,后者是抽象的,虚玄的。由具体走到抽象是一条不错的道路。

最终,机率论又成为推理统计学的理论基础。在随机的说不準中,我们还是要以机率的语言,透过机率法则,定量地来述说我们感兴趣的事件之机率。

因此,我们就先从记述统计学谈起。

假设我担任一班微积分课,共有 $$144$$ 位学生,用集合 $$\Omega$$ 表示全班同学:

$$\Omega = \{\omega_1,\omega_2,…,\omega_N\}$$,$$N=144$$

其中 $$\omega_{k}$$ 可以想成第 $$k$$ 号同学。集合 $$\Omega$$ 就是我们要做“统计” 研究的全体对象,称为母群体(population),千万不要翻译成「人口」。

现在考虑某次考试的成绩,我们用 $$X$$ 代表成绩:

$$X:\Omega\rightarrow \mathbb{R}$$

例如 $$X(\omega_{k})=90$$ 就表示学生 $$\omega_{k}$$ 的成绩为 $$90$$ 分。一般而言,我们令

$$X(\omega_1)=x_1,~X(\omega_2)=x_2,\cdots,~X(\omega_N)=x_N$$

所以就有一堆数据:$$\{x_1,x_2,\dots,x_N\}$$,此地 $$N=144$$。我们用 $$X$$ 来代表成绩这个「统计变量」。所以,事实上,$$X$$ 是一个映射:$$\omega_{1}\rightarrow x_{1}, \omega_{2}\rightarrow x_{2},\dots , \omega_{N}\rightarrow x_{N}$$;而 $$\{x_1,x_2,\dots,x_N\}$$ 是 $$X$$ 的取值,表示所有的统计数据(statistical data)。

【例1】目前台湾社会的贫富差距越来越大,如果我们想要了解台北市民的收入情形,那幺台北市民就是母群体 $$\Omega$$,统计变量就是收入函数 $$X:\Omega\rightarrow\mathbb{R}$$,例如张三 $$\omega\in\Omega$$ 的收入为 $$5$$ 万,则 $$X(\omega)=5$$ 万。

通常因为集合 $$\Omega$$ 的元素太多,要做全数观测的普查工作太花钱又困难,所以统计学就随机从 $$\Omega$$ 中抽出一组样本,例如 $$1000$$ 人,得到收入的数据,用来做「以偏概全」的统计研究,要说明研究结论的好坏就要用到机率论。

【例2】$$311$$ 日本发生大地震,引发海啸,导致核电厂的灾难。接着就引起日本社会开始讨论是否要废核。如果要用统计来研究,日本公民就是母群体 $$\Omega$$,统计变量就是 $$X:\Omega\rightarrow\{$$ 废核,不废核,其它 $$\}$$。这也难以普查,只能用抽样调查或公民投票。只有像某班的考试成绩这类问题,$$\Omega$$ 的元素不多,可以全数观测,然后作成统计图表,观看图表就知道全班概况。

连结:初等的机率论(2)代表值与参差度

参考书目:

注:通常要讲述机率论必须用到「测度积分论」的数学工具,或至少要用到微积分。因此要为一般读者介绍机率论的读物诚属不容易。上述八本书尽量压低要用到的数学工具,大部分只需排列与组合,只有少部份要用到一点儿微积分。

从科学方法论的观点来看,机率论与统计学是一体的两面,机率论是「演绎法」,统计学是「归纳法」。因此,本文的主题虽然是机率论,但是也顺便介绍一点点统计学的概念。

上一篇: 下一篇:

相关阅读

猜你喜欢