【草稿】概率论反思
说明
本文旨在探讨两个问题:
- 概率论对现实的描述何以可能指导现实活动?
- 统计出的、计算出的概率为何合理?
- 提出合理的假设何以可能?
- 概率论能多大程度地描述现实?
- 当我们掷一个骰子时,我们何时把它看作每面 1/6 概率朝下而忽略材质的不均匀、抛掷的手法、空气的流动?
- 我们应如何掌握这种判断的“把握”?
本文主要基于 William Feller 所作的经典 An Introduction to Probability Theory and Its Application.
讨论的可能
第一个问题涉及了一个更基本的问题——认识论的问题。这不在本文讨论范围内。因此,希望读者认可:以某种方式,以概率论对现实的描述指导现实活动是可能的。为此,你或许可以采取以下选择:
- 盲信。时代、文化的变化已经塑造了(大部分时候)足以应对生活的直观认识。
人类的集体直观能力也在进步着 … 同样,现在的学生不会体会到,当概率论还在萌芽的时候,它与某些思维方式、偏见及其他困难的斗争情形。
- 实用主义。概率论是一个(从经验上看/从权威上看/从自己对数学推导的认可上看)好用的模型。
我们所关心的不是归纳推理的形态,而是一种可以叫作是物理概率或者统计概率的事物 … 我们所说的判断不是关于这些的判断,而是关于一个理想实验的可能结果 … 大家必须先承认一个特殊理想实验的想象模型。
- 其它可能的论证。如果你对形而上内容的了解可以支撑。
因此,让我们讨论它的两个子问题,并使用确定的方式列举事实。
从观察到理论 1
这一过程需要理想化。
硬币掉下时不一定是正面朝上或反面朝上,它可能是滚掉了,也可能是笔直地站着,但是我们只承认正面和反面是扔硬币以后仅有的可能结果,这样一来,理论要简洁得多了,同时也不影响其应用,这种类型的理想化是实践中标准的处理办法。测定原子的寿命或人的寿命而没有误差是不可能的,但是为了理论上的目的,我们不妨设想寿命是实实在在的一个数,这样问题就产生了:什么样的数值能确实地代表一个人的寿命?有没有生命不可逾越的最大年龄?是否一切年龄都是可以设想的呢?一方面,谁也不认为人能活到一千岁;另一方面,现行的保险业务对于人的可能寿命却不加任何上限,按照寿险死亡率表所基于的公式算出来,千年不死的人在全人类中大约只占 $10^{10^{36}}$ 分之一,$10^{10^{36}}$ 这个数共含有 $10^{28}$ 亿个零,这个结论从生物学或社会学的角度看来,固然是毫无意义的,但是单纯从统计上着眼,它和经验当然没有什么矛盾,因为一个世纪内出生的人数还不到 $10^{10}$。要想用统计方法来检验上述说法,就需要 $10^{10^{35}}$ 个世纪以上的时间,而这个时间段比地球的寿命的 $10^{10^{34}}$ 倍还要大得多,毫无疑问,这样小的概率和我们心目中的“不可能性”是没有什么矛盾的。你也许认为,这种小概率的使用本身就是荒谬绝伦的,其实不然,使用这种小概率非但没有坏处,而且还可以简化公式,再说,如果我们真地把活一千年的可能性排除掉,我们势必承认一个最大年龄限 $x$ 的存在,说人能活 $x$ 年而不能活 $x$ 年零两秒,这种说法决不会比无限寿命的说法更能讲得通些。
把实验或观察的结果称作事件。分为复合事件与简单事件。
直观上,简单事件是不可分解的。这里我们不把将“摸到黑球”拆成“今天在下雨并且摸到了黑球”和“今天不在下雨并且摸到了黑球”视作“分解”——我们约定简单事件是不作定义的。
一个不可分解的结果用样本点表示,其全体称为样本空间。
我们用集合的语言来描述样本空间,事件为样本点的集合。
公理化
与其它所有数学理论一样,概率论的公理化充满理想化的成分。
回顾 Kolmogorov 的公理化定义:
给定集合 $\Omega$,如果 $\mathfrak{F}\subset 2^\Omega$ 满足:
- $\Omega\in\mathfrak{F}$
- 取逆封闭:若 $A\in\mathfrak{F}$ 则
$$\bar{A}\in\mathfrak{F}$$
- 可列并封闭:若 $\{A_n\}_{n\geq 1}\subset \mathfrak{F}$ 则
$$\bigcup\limits_{n=1}^{+\infty} A_n\in\mathfrak{F}$$
则称 $\mathfrak{F}$ 为 $\Omega$ 上的 σ-代数。
$\mathfrak{F}$ 上的概率 $P: 2^\Omega\to \mathbb{R}$ 满足
- 非负:$P(A)\geq 0$
- 规范性:
- 可列可加性:对 $\{A_n\}_{n\geq 1}$ 两两不交
$$P(\bigcup\limits_{n=1}^{+\infty} A_n) = \sum_{n=1}^{+\infty} P(A_n)$$
离散样本空间
三门问题
频率学派和贝叶斯学派。
如果你疑心这是不可能使用纯数学的语言描述出来的,可以将其跳过。