第 3 章 多维随机变量及其分布⚓︎
约 1877 个字 预计阅读时间 6 分钟 总阅读量 次
本章核心
知识框架:
- 联合分布 → 边缘分布 → 条件分布 → 独立性
- 随机变量函数的分布:卷积公式、变量变换法 (Jacobian)
- 重要结论:二维正态分布中独立 ⟺ 不相关
3.1 二维随机变量及其分布⚓︎
1. 二维随机变量的定义⚓︎
设 \(E\) 是一个随机试验,样本点是 \(e\),若 \(X_1(e), X_2(e), \dots, X_n(e)\) 是定义在样本空间上的 \(n\) 个随机变量,则称 \(X = (X_1, X_2, \dots, X_n)\) 构成一个 \(n\) 维随机变量。重点讨论二维随机变量 \((X, Y)\)。
2. 联合分布函数⚓︎
联合分布函数
定义:对于任意实数 \(x, y\),二元函数 \(F(x, y) = P\{X \le x, Y \le y\}\) 称为二维随机变量 \((X, Y)\) 的 联合分布函数
几何意义:\(F(x, y)\) 表示随机点 \((X, Y)\) 落在区域 \((-\infty, x] \times (-\infty, y]\) 内的概率
矩形域概率计算:
\[ P\{x_1 < X \le x_2, y_1 < Y \le y_2\} = F(x_2, y_2) - F(x_1, y_2) - F(x_2, y_1) + F(x_1, y_1) \]
基本性质:
- 单调性:\(F(x, y)\) 关于 \(x\) 或 \(y\) 单调不减
- 有界性:\(0 \le F(x, y) \le 1\),且 \(F(-\infty, y) = F(x, -\infty) = F(-\infty, -\infty) = 0\),\(F(+\infty, +\infty) = 1\)
- 右连续性:\(F(x, y)\) 关于 \(x, y\) 均右连续
- 非负性:对于任意 \(x_1 < x_2, y_1 < y_2\),有 \(F(x_2, y_2) - F(x_1, y_2) - F(x_2, y_1) + F(x_1, y_1) \ge 0\)
3. 二维离散型随机变量⚓︎
离散型随机变量
定义:若 \((X, Y)\) 所有可能取值是有限多对或可列多对,则称为二维离散型随机变量
联合分布律:
\[ P\{X = x_i, Y = y_j\} = p_{ij}, \quad i, j = 1, 2, \dots \]
性质:
- \(p_{ij} \ge 0\)
- \(\sum_i \sum_j p_{ij} = 1\)
4. 二维连续型随机变量⚓︎
连续型随机变量
定义:若存在非负函数 \(f(x, y)\),使得对于任意 \(x, y\) 有:
\[ F(x, y) = \int_{-\infty}^x \int_{-\infty}^y f(u, v) \, \mathrm{d}u \mathrm{d}v \]
则称 \((X, Y)\) 为连续型,\(f(x, y)\) 为 联合概率密度
性质:
- \(f(x, y) \ge 0\)
- \(\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} f(x, y) \, \mathrm{d}x \mathrm{d}y = 1\)
- 若 \(f(x, y)\) 在点 \((x, y)\) 连续,则 \(\frac{\partial^2 F(x, y)}{\partial x \partial y} = f(x, y)\)
- 概率计算:\((X, Y)\) 落在平面区域 \(G\) 内的概率为:
\[ P\{(X, Y) \in G\} = \iint_G f(x, y) \, \mathrm{d}x \mathrm{d}y \]
5. 常见二维分布⚓︎
二维均匀分布⚓︎
设 \(G\) 是平面上的有界区域,面积为 \(A\)。若:
\[ f(x, y) = \begin{cases} \frac{1}{A}, & (x, y) \in G \\ 0, & \text{其它} \end{cases} \]
则称 \((X, Y)\) 在 \(G\) 上服从均匀分布。概率只与子区域面积有关,与位置形状无关。
二维正态分布⚓︎
记为 \((X, Y) \sim N(\mu_1, \mu_2, \sigma_1^2, \sigma_2^2, \rho)\)。
概率密度函数包含参数: - \(\mu_1, \mu_2\):均值 - \(\sigma_1, \sigma_2\):标准差 - \(\rho\):相关系数
3.2 边缘分布⚓︎
1. 边缘分布函数⚓︎
- \(F_X(x) = P\{X \le x\} = F(x, +\infty)\)
- \(F_Y(y) = P\{Y \le y\} = F(+\infty, y)\)
2. 边缘分布律 (离散型)⚓︎
- 关于 \(X\) 的边缘分布律:\(P\{X = x_i\} = p_{i\cdot} = \sum_j p_{ij}\)
- 关于 \(Y\) 的边缘分布律:\(P\{Y = y_j\} = p_{\cdot j} = \sum_i p_{ij}\)
3. 边缘概率密度 (连续型)⚓︎
- 关于 \(X\) 的边缘密度:\(f_X(x) = \int_{-\infty}^{+\infty} f(x, y) \, \mathrm{d}y\)
- 关于 \(Y\) 的边缘密度:\(f_Y(y) = \int_{-\infty}^{+\infty} f(x, y) \, \mathrm{d}x\)
4. 重要结论⚓︎
关键结论
-
联合分布唯一确定边缘分布,但边缘分布不能唯一确定联合分布(除非独立)
-
二维正态分布的边缘分布:若 \((X, Y) \sim N(\mu_1, \mu_2, \sigma_1^2, \sigma_2^2, \rho)\),则:
- \(X \sim N(\mu_1, \sigma_1^2)\)
- \(Y \sim N(\mu_2, \sigma_2^2)\)
-
即二维正态分布的边缘分布仍为正态分布,且与 \(\rho\) 无关
-
注意:边缘分布均为正态分布,联合分布不一定是二维正态分布
3.3 条件分布⚓︎
1. 离散型条件分布律⚓︎
在 \(Y = y_j\) 条件下 \(X\) 的条件分布律:
\[ P\{X = x_i | Y = y_j\} = \frac{P\{X = x_i, Y = y_j\}}{P\{Y = y_j\}} = \frac{p_{ij}}{p_{\cdot j}}, \quad (p_{\cdot j} > 0) \]
在 \(X = x_i\) 条件下 \(Y\) 的条件分布律:
\[ P\{Y = y_j | X = x_i\} = \frac{p_{ij}}{p_{i\cdot}}, \quad (p_{i\cdot} > 0) \]
2. 连续型条件概率密度⚓︎
在 \(Y = y\) 条件下 \(X\) 的条件概率密度:
\[ f_{X|Y}(x|y) = \frac{f(x, y)}{f_Y(y)}, \quad (f_Y(y) > 0) \]
在 \(X = x\) 条件下 \(Y\) 的条件概率密度:
\[ f_{Y|X}(y|x) = \frac{f(x, y)}{f_X(x)}, \quad (f_X(x) > 0) \]
条件分布函数:
\[ F_{X|Y}(x|y) = \int_{-\infty}^x f_{X|Y}(u|y) \, \mathrm{d}u \]
3. 应用扩展⚓︎
条件概率可用于处理分阶段试验或已知部分信息更新概率的问题(类似全概率公式与贝叶斯公式的思想)。
3.4 相互独立的随机变量⚓︎
1. 独立性的定义⚓︎
独立性定义
一般定义:若对于所有的 \(x, y\),有 \(F(x, y) = F_X(x) F_Y(y)\),则称 \(X\) 与 \(Y\) 相互独立
离散型充要条件:对于任意 \((x_i, y_j)\),有 \(p_{ij} = p_{i\cdot} p_{\cdot j}\)
连续型充要条件:在 \(f(x, y)\) 的连续点处,有 \(f(x, y) = f_X(x) f_Y(y)\)
2. 重要性质与结论⚓︎
独立性的重要性质
-
边缘确定联合:若 \(X, Y\) 独立,则联合分布可由边缘分布唯一确定
-
函数的独立性:若 \(X, Y\) 独立,\(h, g\) 是连续函数,则 \(h(X)\) 与 \(g(Y)\) 也相互独立
-
二维正态分布的独立性:若 \((X, Y)\) 服从二维正态分布,则 \(X\) 与 \(Y\) 相互独立的 充要条件是 \(\rho = 0\)
注:对于一般分布,不相关 (\(\rho=0\)) 不一定独立;但对于二维正态分布,不相关 ⟺ 独立
-
条件密度与独立性:若 \(X, Y\) 独立,则条件密度等于无条件密度,即 \(f_{X|Y}(x|y) = f_X(x)\)
3.5 两个随机变量函数的分布⚓︎
1. 分布函数法 (通用方法)⚓︎
设 \(Z = g(X, Y)\),求 \(Z\) 的分布。
步骤:
- 求分布函数:
\[ F_Z(z) = P\{Z \le z\} = P\{g(X, Y) \le z\} = \iint_{g(x,y) \le z} f(x, y) \, \mathrm{d}x \mathrm{d}y \]
- 求密度函数:
\[ f_Z(z) = F_Z'(z) \]
2. 和的分布 (\(Z = X + Y\))⚓︎
卷积公式
若 \(X, Y\) 独立,则 \(Z = X + Y\) 的概率密度为:
\[ f_Z(z) = \int_{-\infty}^{+\infty} f_X(x) f_Y(z - x) \, \mathrm{d}x = \int_{-\infty}^{+\infty} f_X(z - y) f_Y(y) \, \mathrm{d}y \]
记为 \(f_Z = f_X * f_Y\)
重要结论:
-
正态分布的可加性:若 \(X \sim N(\mu_1, \sigma_1^2), Y \sim N(\mu_2, \sigma_2^2)\) 且独立,则: $$ X + Y \sim N(\mu_1 + \mu_2, \sigma_1^2 + \sigma_2^2) $$ 有限个独立正态变量的线性组合仍服从正态分布
-
泊松分布的可加性:若 \(X \sim \pi(\lambda_1), Y \sim \pi(\lambda_2)\) 且独立,则: $$ X + Y \sim \pi(\lambda_1 + \lambda_2) $$
3. 商的分布 (\(Z = X / Y\))⚓︎
密度函数公式(若 \(X, Y\) 独立):
\[ f_Z(z) = \int_{-\infty}^{+\infty} |y| f_X(zy) f_Y(y) \, \mathrm{d}y \]
4. 最大值与最小值的分布⚓︎
设 \(X, Y\) 独立,分布函数分别为 \(F_X(x), F_Y(y)\)。
最值分布公式
最大值 \(M = \max\{X, Y\}\):
\[ F_M(z) = F_X(z) F_Y(z) \]
最小值 \(N = \min\{X, Y\}\):
\[ F_N(z) = 1 - [1 - F_X(z)][1 - F_Y(z)] \]
推广到 \(n\) 个独立同分布变量:
若 \(X_i \sim F(x)\),则:
- \(F_{\max}(z) = [F(z)]^n\)
- \(F_{\min}(z) = 1 - [1 - F(z)]^n\)
5. 特殊分布扩展⚓︎
-
\(\chi^2\) 分布:设 \(X_1, \dots, X_n\) 相互独立且均服从 \(N(0, 1)\),则 \(Y = \sum_{i=1}^n X_i^2\) 服从自由度为 \(n\) 的 \(\chi^2\) 分布
-
瑞利分布:若 \(X, Y\) 独立同分布于 \(N(0, \sigma^2)\),则 \(Z = \sqrt{X^2 + Y^2}\) 服从参数为 \(\sigma\) 的瑞利分布
3.6 随机变量函数的联合分布⚓︎
1. 变量变换法 (Jacobian)⚓︎
设 \((X_1, X_2)\) 联合密度为 \(f_{X_1, X_2}(x_1, x_2)\),变换 \(Y_1 = g_1(X_1, X_2), Y_2 = g_2(X_1, X_2)\) 满足:
- 存在唯一反函数 \(x_1 = h_1(y_1, y_2), x_2 = h_2(y_1, y_2)\)
- 函数具有连续偏导数,且 Jacobian 行列式 \(J = \frac{\partial(g_1, g_2)}{\partial(x_1, x_2)} \neq 0\)
则 \((Y_1, Y_2)\) 的联合密度为:
\[ f_{Y_1, Y_2}(y_1, y_2) = f_{X_1, X_2}(x_1, x_2) \cdot |J|^{-1} \]
其中 \(x_1, x_2\) 需用 \(y_1, y_2\) 代入。
3.7 \(n\) 维随机变量简介⚓︎
1. 基本定义推广⚓︎
- 联合分布函数:\(F(x_1, \dots, x_n) = P\{X_1 \le x_1, \dots, X_n \le x_n\}\)
- 联合概率密度:\(f(x_1, \dots, x_n)\),满足非负性与归一性 (\(\int \dots \int f = 1\))
- 边缘分布:\(k\) 维边缘分布是通过对其余 \(n-k\) 个变量积分(连续型)或求和(离散型)得到
2. \(n\) 维独立性⚓︎
- \(X_1, \dots, X_n\) 相互独立 \(\iff F(x_1, \dots, x_n) = \prod_{i=1}^n F_{X_i}(x_i)\)
- 连续型充要条件:\(f(x_1, \dots, x_n) = \prod_{i=1}^n f_{X_i}(x_i)\)
3. 重要结论⚓︎
-
正态变量之和:独立正态变量的和仍服从正态分布,参数为均值相加、方差相加
-
最大值与最小值分布:
- \(F_{\max}(z) = \prod_{i=1}^n F_i(z)\)
- \(F_{\min}(z) = 1 - \prod_{i=1}^n [1 - F_i(z)]\)
难点与易错点提示⚓︎
易错点警示
-
联合与边缘的关系:联合分布包含的信息量最大,可以推导边缘和条件分布;但仅知边缘分布通常无法恢复联合分布(除非已知独立)
-
积分区域的确定:在计算连续型随机变量函数的分布(如卷积公式、分布函数法)时,正确画出积分区域 \(G\) 并确定积分上下限是难点
-
独立性与不相关:一般情况下,独立 \(\Rightarrow\) 不相关,但不相关 \(\nRightarrow\) 独立。 例外:二维正态分布中,独立 \(\iff\) 不相关 (\(\rho=0\))
-
条件概率密度定义域:计算条件密度 \(f_{X|Y}(x|y)\) 时,需注意 \(f_Y(y) > 0\) 的条件,且结果仅在联合密度的非零区域内有效
-
变量变换的 Jacobian:在使用变换法求联合分布时,勿忘乘以 Jacobian 行列式的绝对值,且需将原变量用新变量表示后代入原密度函数
核心要点回顾
- 联合分布函数:\(F(x,y) = P\{X \le x, Y \le y\}\),矩形域概率用四角公式
- 边缘分布:离散型求和,连续型积分
- 独立性:\(F(x,y) = F_X(x)F_Y(y)\),二维正态中独立 ⟺ \(\rho=0\)
- 卷积公式:\(f_Z(z) = \int f_X(x)f_Y(z-x)dx\)
- 最值分布:最大值乘积,最小值补集乘积
- 变量变换:勿忘乘以 \(|J|^{-1}\)