第 3 章多维随机变量及其分布⚓︎

约 1877 个字预计阅读时间 6 分钟总阅读量次

本章核心

知识框架：

联合分布 → 边缘分布 → 条件分布 → 独立性
随机变量函数的分布：卷积公式、变量变换法 (Jacobian)
重要结论：二维正态分布中独立 ⟺ 不相关

3.1 二维随机变量及其分布⚓︎

1. 二维随机变量的定义⚓︎

设 $E$ 是一个随机试验，样本点是 $e$，若 $X_1(e), X_2(e), \dots, X_n(e)$ 是定义在样本空间上的 $n$ 个随机变量，则称 $X = (X_1, X_2, \dots, X_n)$ 构成一个 $n$ 维随机变量。重点讨论二维随机变量 $(X, Y)$。

2. 联合分布函数⚓︎

联合分布函数

定义：对于任意实数 $x, y$，二元函数 $F(x, y) = P\{X \le x, Y \le y\}$ 称为二维随机变量 $(X, Y)$ 的 联合分布函数

几何意义：$F(x, y)$ 表示随机点 $(X, Y)$ 落在区域 $(-\infty, x] \times (-\infty, y]$ 内的概率

矩形域概率计算：

\[ P\{x_1 < X \le x_2, y_1 < Y \le y_2\} = F(x_2, y_2) - F(x_1, y_2) - F(x_2, y_1) + F(x_1, y_1) \]

基本性质：

单调性：$F(x, y)$ 关于 $x$ 或 $y$ 单调不减
有界性：$0 \le F(x, y) \le 1$，且 $F(-\infty, y) = F(x, -\infty) = F(-\infty, -\infty) = 0$，$F(+\infty, +\infty) = 1$
右连续性：$F(x, y)$ 关于 $x, y$ 均右连续
非负性：对于任意 $x_1 < x_2, y_1 < y_2$，有 $F(x_2, y_2) - F(x_1, y_2) - F(x_2, y_1) + F(x_1, y_1) \ge 0$

3. 二维离散型随机变量⚓︎

离散型随机变量

定义：若 $(X, Y)$ 所有可能取值是有限多对或可列多对，则称为二维离散型随机变量

联合分布律：

\[ P\{X = x_i, Y = y_j\} = p_{ij}, \quad i, j = 1, 2, \dots \]

性质：

$p_{ij} \ge 0$
$\sum_i \sum_j p_{ij} = 1$

4. 二维连续型随机变量⚓︎

连续型随机变量

定义：若存在非负函数 $f(x, y)$，使得对于任意 $x, y$ 有：

\[ F(x, y) = \int_{-\infty}^x \int_{-\infty}^y f(u, v) \, \mathrm{d}u \mathrm{d}v \]

则称 $(X, Y)$ 为连续型，$f(x, y)$ 为 联合概率密度

性质：

$f(x, y) \ge 0$
$\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} f(x, y) \, \mathrm{d}x \mathrm{d}y = 1$
若 $f(x, y)$ 在点 $(x, y)$ 连续，则 $\frac{\partial^2 F(x, y)}{\partial x \partial y} = f(x, y)$
概率计算：$(X, Y)$ 落在平面区域 $G$ 内的概率为：

\[ P\{(X, Y) \in G\} = \iint_G f(x, y) \, \mathrm{d}x \mathrm{d}y \]

5. 常见二维分布⚓︎

二维均匀分布⚓︎

设 $G$ 是平面上的有界区域，面积为 $A$。若：

\[ f(x, y) = \begin{cases} \frac{1}{A}, & (x, y) \in G \\ 0, & \text{其它} \end{cases} \]

则称 $(X, Y)$ 在 $G$ 上服从均匀分布。概率只与子区域面积有关，与位置形状无关。

二维正态分布⚓︎

记为 $(X, Y) \sim N(\mu_1, \mu_2, \sigma_1^2, \sigma_2^2, \rho)$。

概率密度函数包含参数： - $\mu_1, \mu_2$：均值 - $\sigma_1, \sigma_2$：标准差 - $\rho$：相关系数

3.2 边缘分布⚓︎

1. 边缘分布函数⚓︎

$F_X(x) = P\{X \le x\} = F(x, +\infty)$
$F_Y(y) = P\{Y \le y\} = F(+\infty, y)$

2. 边缘分布律 (离散型)⚓︎

关于 $X$ 的边缘分布律：$P\{X = x_i\} = p_{i\cdot} = \sum_j p_{ij}$
关于 $Y$ 的边缘分布律：$P\{Y = y_j\} = p_{\cdot j} = \sum_i p_{ij}$

3. 边缘概率密度 (连续型)⚓︎

关于 $X$ 的边缘密度：$f_X(x) = \int_{-\infty}^{+\infty} f(x, y) \, \mathrm{d}y$
关于 $Y$ 的边缘密度：$f_Y(y) = \int_{-\infty}^{+\infty} f(x, y) \, \mathrm{d}x$

4. 重要结论⚓︎

关键结论

联合分布唯一确定边缘分布，但边缘分布不能唯一确定联合分布（除非独立）
二维正态分布的边缘分布：若 $(X, Y) \sim N(\mu_1, \mu_2, \sigma_1^2, \sigma_2^2, \rho)$，则：
$X \sim N(\mu_1, \sigma_1^2)$
$Y \sim N(\mu_2, \sigma_2^2)$
即二维正态分布的边缘分布仍为正态分布，且与 $\rho$ 无关
注意：边缘分布均为正态分布，联合分布不一定是二维正态分布

3.3 条件分布⚓︎

1. 离散型条件分布律⚓︎

在 $Y = y_j$ 条件下 $X$ 的条件分布律：

\[ P\{X = x_i | Y = y_j\} = \frac{P\{X = x_i, Y = y_j\}}{P\{Y = y_j\}} = \frac{p_{ij}}{p_{\cdot j}}, \quad (p_{\cdot j} > 0) \]

在 $X = x_i$ 条件下 $Y$ 的条件分布律：

\[ P\{Y = y_j | X = x_i\} = \frac{p_{ij}}{p_{i\cdot}}, \quad (p_{i\cdot} > 0) \]

2. 连续型条件概率密度⚓︎

在 $Y = y$ 条件下 $X$ 的条件概率密度：

\[ f_{X|Y}(x|y) = \frac{f(x, y)}{f_Y(y)}, \quad (f_Y(y) > 0) \]

在 $X = x$ 条件下 $Y$ 的条件概率密度：

\[ f_{Y|X}(y|x) = \frac{f(x, y)}{f_X(x)}, \quad (f_X(x) > 0) \]

条件分布函数：

\[ F_{X|Y}(x|y) = \int_{-\infty}^x f_{X|Y}(u|y) \, \mathrm{d}u \]

3. 应用扩展⚓︎

条件概率可用于处理分阶段试验或已知部分信息更新概率的问题（类似全概率公式与贝叶斯公式的思想）。

3.4 相互独立的随机变量⚓︎

1. 独立性的定义⚓︎

独立性定义

一般定义：若对于所有的 $x, y$，有 $F(x, y) = F_X(x) F_Y(y)$，则称 $X$ 与 $Y$ 相互独立

离散型充要条件：对于任意 $(x_i, y_j)$，有 $p_{ij} = p_{i\cdot} p_{\cdot j}$

连续型充要条件：在 $f(x, y)$ 的连续点处，有 $f(x, y) = f_X(x) f_Y(y)$

2. 重要性质与结论⚓︎

独立性的重要性质

边缘确定联合：若 $X, Y$ 独立，则联合分布可由边缘分布唯一确定
函数的独立性：若 $X, Y$ 独立，$h, g$ 是连续函数，则 $h(X)$ 与 $g(Y)$ 也相互独立
二维正态分布的独立性：若 $(X, Y)$ 服从二维正态分布，则 $X$ 与 $Y$ 相互独立的 充要条件是 $\rho = 0$

注：对于一般分布，不相关 ($\rho=0$) 不一定独立；但对于二维正态分布，不相关 ⟺ 独立
条件密度与独立性：若 $X, Y$ 独立，则条件密度等于无条件密度，即 $f_{X|Y}(x|y) = f_X(x)$

3.5 两个随机变量函数的分布⚓︎

1. 分布函数法 (通用方法)⚓︎

设 $Z = g(X, Y)$，求 $Z$ 的分布。

步骤：

求分布函数：

\[ F_Z(z) = P\{Z \le z\} = P\{g(X, Y) \le z\} = \iint_{g(x,y) \le z} f(x, y) \, \mathrm{d}x \mathrm{d}y \]

求密度函数：

\[ f_Z(z) = F_Z'(z) \]

2. 和的分布 ($Z = X + Y$)⚓︎

卷积公式

若 $X, Y$ 独立，则 $Z = X + Y$ 的概率密度为：

\[ f_Z(z) = \int_{-\infty}^{+\infty} f_X(x) f_Y(z - x) \, \mathrm{d}x = \int_{-\infty}^{+\infty} f_X(z - y) f_Y(y) \, \mathrm{d}y \]

记为 $f_Z = f_X * f_Y$

重要结论：

正态分布的可加性：若 $X \sim N(\mu_1, \sigma_1^2), Y \sim N(\mu_2, \sigma_2^2)$ 且独立，则： $$ X + Y \sim N(\mu_1 + \mu_2, \sigma_1^2 + \sigma_2^2) $$ 有限个独立正态变量的线性组合仍服从正态分布
泊松分布的可加性：若 $X \sim \pi(\lambda_1), Y \sim \pi(\lambda_2)$ 且独立，则： $$ X + Y \sim \pi(\lambda_1 + \lambda_2) $$

3. 商的分布 ($Z = X / Y$)⚓︎

密度函数公式（若 $X, Y$ 独立）：

\[ f_Z(z) = \int_{-\infty}^{+\infty} |y| f_X(zy) f_Y(y) \, \mathrm{d}y \]

4. 最大值与最小值的分布⚓︎

设 $X, Y$ 独立，分布函数分别为 $F_X(x), F_Y(y)$。

最值分布公式

最大值 $M = \max\{X, Y\}$：

\[ F_M(z) = F_X(z) F_Y(z) \]

最小值 $N = \min\{X, Y\}$：

\[ F_N(z) = 1 - [1 - F_X(z)][1 - F_Y(z)] \]

推广到 $n$ 个独立同分布变量：

若 $X_i \sim F(x)$，则：

$F_{\max}(z) = [F(z)]^n$
$F_{\min}(z) = 1 - [1 - F(z)]^n$

5. 特殊分布扩展⚓︎

$\chi^2$ 分布：设 $X_1, \dots, X_n$ 相互独立且均服从 $N(0, 1)$，则 $Y = \sum_{i=1}^n X_i^2$ 服从自由度为 $n$ 的 $\chi^2$ 分布
瑞利分布：若 $X, Y$ 独立同分布于 $N(0, \sigma^2)$，则 $Z = \sqrt{X^2 + Y^2}$ 服从参数为 $\sigma$ 的瑞利分布

3.6 随机变量函数的联合分布⚓︎

1. 变量变换法 (Jacobian)⚓︎

设 $(X_1, X_2)$ 联合密度为 $f_{X_1, X_2}(x_1, x_2)$，变换 $Y_1 = g_1(X_1, X_2), Y_2 = g_2(X_1, X_2)$ 满足：

存在唯一反函数 $x_1 = h_1(y_1, y_2), x_2 = h_2(y_1, y_2)$
函数具有连续偏导数，且 Jacobian 行列式 $J = \frac{\partial(g_1, g_2)}{\partial(x_1, x_2)} \neq 0$

则 $(Y_1, Y_2)$ 的联合密度为：

\[ f_{Y_1, Y_2}(y_1, y_2) = f_{X_1, X_2}(x_1, x_2) \cdot |J|^{-1} \]

其中 $x_1, x_2$ 需用 $y_1, y_2$ 代入。

3.7 $n$ 维随机变量简介⚓︎

1. 基本定义推广⚓︎

联合分布函数：$F(x_1, \dots, x_n) = P\{X_1 \le x_1, \dots, X_n \le x_n\}$
联合概率密度：$f(x_1, \dots, x_n)$，满足非负性与归一性 ($\int \dots \int f = 1$)
边缘分布：$k$ 维边缘分布是通过对其余 $n-k$ 个变量积分（连续型）或求和（离散型）得到

2. $n$ 维独立性⚓︎

$X_1, \dots, X_n$ 相互独立 $\iff F(x_1, \dots, x_n) = \prod_{i=1}^n F_{X_i}(x_i)$
连续型充要条件：$f(x_1, \dots, x_n) = \prod_{i=1}^n f_{X_i}(x_i)$

3. 重要结论⚓︎

正态变量之和：独立正态变量的和仍服从正态分布，参数为均值相加、方差相加
最大值与最小值分布：
$F_{\max}(z) = \prod_{i=1}^n F_i(z)$
$F_{\min}(z) = 1 - \prod_{i=1}^n [1 - F_i(z)]$

难点与易错点提示⚓︎

易错点警示

联合与边缘的关系：联合分布包含的信息量最大，可以推导边缘和条件分布；但仅知边缘分布通常无法恢复联合分布（除非已知独立）
积分区域的确定：在计算连续型随机变量函数的分布（如卷积公式、分布函数法）时，正确画出积分区域 $G$ 并确定积分上下限是难点
独立性与不相关：一般情况下，独立 $\Rightarrow$ 不相关，但不相关 $\nRightarrow$ 独立。例外：二维正态分布中，独立 $\iff$ 不相关 ($\rho=0$)
条件概率密度定义域：计算条件密度 $f_{X|Y}(x|y)$ 时，需注意 $f_Y(y) > 0$ 的条件，且结果仅在联合密度的非零区域内有效
变量变换的 Jacobian：在使用变换法求联合分布时，勿忘乘以 Jacobian 行列式的绝对值，且需将原变量用新变量表示后代入原密度函数

核心要点回顾

联合分布函数：$F(x,y) = P\{X \le x, Y \le y\}$，矩形域概率用四角公式
边缘分布：离散型求和，连续型积分
独立性：$F(x,y) = F_X(x)F_Y(y)$，二维正态中独立 ⟺ $\rho=0$
卷积公式：$f_Z(z) = \int f_X(x)f_Y(z-x)dx$
最值分布：最大值乘积，最小值补集乘积
变量变换：勿忘乘以 $|J|^{-1}$

第 3 章多维随机变量及其分布⚓︎

3.1 二维随机变量及其分布⚓︎

1. 二维随机变量的定义⚓︎

2. 联合分布函数⚓︎

3. 二维离散型随机变量⚓︎

4. 二维连续型随机变量⚓︎

5. 常见二维分布⚓︎

二维均匀分布⚓︎

二维正态分布⚓︎

3.2 边缘分布⚓︎

1. 边缘分布函数⚓︎

2. 边缘分布律 (离散型)⚓︎

3. 边缘概率密度 (连续型)⚓︎

4. 重要结论⚓︎

3.3 条件分布⚓︎

1. 离散型条件分布律⚓︎

2. 连续型条件概率密度⚓︎

3. 应用扩展⚓︎

3.4 相互独立的随机变量⚓︎

1. 独立性的定义⚓︎

2. 重要性质与结论⚓︎

3.5 两个随机变量函数的分布⚓︎

1. 分布函数法 (通用方法)⚓︎

2. 和的分布 (\(Z = X + Y\))⚓︎

3. 商的分布 (\(Z = X / Y\))⚓︎

4. 最大值与最小值的分布⚓︎

5. 特殊分布扩展⚓︎

3.6 随机变量函数的联合分布⚓︎

1. 变量变换法 (Jacobian)⚓︎

3.7 \(n\) 维随机变量简介⚓︎

1. 基本定义推广⚓︎

2. \(n\) 维独立性⚓︎

3. 重要结论⚓︎

难点与易错点提示⚓︎

第 3 章 多维随机变量及其分布⚓︎

3.1 二维随机变量及其分布⚓︎

1. 二维随机变量的定义⚓︎

2. 联合分布函数⚓︎

3. 二维离散型随机变量⚓︎

4. 二维连续型随机变量⚓︎

5. 常见二维分布⚓︎

二维均匀分布⚓︎

二维正态分布⚓︎

3.2 边缘分布⚓︎

1. 边缘分布函数⚓︎

2. 边缘分布律 (离散型)⚓︎

3. 边缘概率密度 (连续型)⚓︎

4. 重要结论⚓︎

3.3 条件分布⚓︎

1. 离散型条件分布律⚓︎

2. 连续型条件概率密度⚓︎

3. 应用扩展⚓︎

3.4 相互独立的随机变量⚓︎

1. 独立性的定义⚓︎

2. 重要性质与结论⚓︎

3.5 两个随机变量函数的分布⚓︎

1. 分布函数法 (通用方法)⚓︎

2. 和的分布 (\(Z = X + Y\))⚓︎

3. 商的分布 (\(Z = X / Y\))⚓︎

4. 最大值与最小值的分布⚓︎

5. 特殊分布扩展⚓︎

3.6 随机变量函数的联合分布⚓︎

1. 变量变换法 (Jacobian)⚓︎

3.7 \(n\) 维随机变量简介⚓︎

1. 基本定义推广⚓︎

2. \(n\) 维独立性⚓︎

3. 重要结论⚓︎

难点与易错点提示⚓︎

第 3 章多维随机变量及其分布⚓︎