跳转至

第 3 章 多维随机变量及其分布⚓︎

约 1877 个字 预计阅读时间 6 分钟 总阅读量

本章核心

知识框架

  1. 联合分布 → 边缘分布 → 条件分布 → 独立性
  2. 随机变量函数的分布:卷积公式、变量变换法 (Jacobian)
  3. 重要结论:二维正态分布中独立 ⟺ 不相关

3.1 二维随机变量及其分布⚓︎

1. 二维随机变量的定义⚓︎

\(E\) 是一个随机试验,样本点是 \(e\),若 \(X_1(e), X_2(e), \dots, X_n(e)\) 是定义在样本空间上的 \(n\) 个随机变量,则称 \(X = (X_1, X_2, \dots, X_n)\) 构成一个 \(n\) 维随机变量。重点讨论二维随机变量 \((X, Y)\)

2. 联合分布函数⚓︎

联合分布函数

定义:对于任意实数 \(x, y\),二元函数 \(F(x, y) = P\{X \le x, Y \le y\}\) 称为二维随机变量 \((X, Y)\)联合分布函数

几何意义\(F(x, y)\) 表示随机点 \((X, Y)\) 落在区域 \((-\infty, x] \times (-\infty, y]\) 内的概率

矩形域概率计算

\[ P\{x_1 < X \le x_2, y_1 < Y \le y_2\} = F(x_2, y_2) - F(x_1, y_2) - F(x_2, y_1) + F(x_1, y_1) \]

基本性质

  1. 单调性\(F(x, y)\) 关于 \(x\)\(y\) 单调不减
  2. 有界性\(0 \le F(x, y) \le 1\),且 \(F(-\infty, y) = F(x, -\infty) = F(-\infty, -\infty) = 0\)\(F(+\infty, +\infty) = 1\)
  3. 右连续性\(F(x, y)\) 关于 \(x, y\) 均右连续
  4. 非负性:对于任意 \(x_1 < x_2, y_1 < y_2\),有 \(F(x_2, y_2) - F(x_1, y_2) - F(x_2, y_1) + F(x_1, y_1) \ge 0\)

3. 二维离散型随机变量⚓︎

离散型随机变量

定义:若 \((X, Y)\) 所有可能取值是有限多对或可列多对,则称为二维离散型随机变量

联合分布律

\[ P\{X = x_i, Y = y_j\} = p_{ij}, \quad i, j = 1, 2, \dots \]

性质

  1. \(p_{ij} \ge 0\)
  2. \(\sum_i \sum_j p_{ij} = 1\)

4. 二维连续型随机变量⚓︎

连续型随机变量

定义:若存在非负函数 \(f(x, y)\),使得对于任意 \(x, y\) 有:

\[ F(x, y) = \int_{-\infty}^x \int_{-\infty}^y f(u, v) \, \mathrm{d}u \mathrm{d}v \]

则称 \((X, Y)\) 为连续型,\(f(x, y)\)联合概率密度

性质

  1. \(f(x, y) \ge 0\)
  2. \(\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} f(x, y) \, \mathrm{d}x \mathrm{d}y = 1\)
  3. \(f(x, y)\) 在点 \((x, y)\) 连续,则 \(\frac{\partial^2 F(x, y)}{\partial x \partial y} = f(x, y)\)
  4. 概率计算\((X, Y)\) 落在平面区域 \(G\) 内的概率为:
\[ P\{(X, Y) \in G\} = \iint_G f(x, y) \, \mathrm{d}x \mathrm{d}y \]

5. 常见二维分布⚓︎

二维均匀分布⚓︎

\(G\) 是平面上的有界区域,面积为 \(A\)。若:

\[ f(x, y) = \begin{cases} \frac{1}{A}, & (x, y) \in G \\ 0, & \text{其它} \end{cases} \]

则称 \((X, Y)\)\(G\) 上服从均匀分布。概率只与子区域面积有关,与位置形状无关

二维正态分布⚓︎

记为 \((X, Y) \sim N(\mu_1, \mu_2, \sigma_1^2, \sigma_2^2, \rho)\)

概率密度函数包含参数: - \(\mu_1, \mu_2\):均值 - \(\sigma_1, \sigma_2\):标准差 - \(\rho\):相关系数


3.2 边缘分布⚓︎

1. 边缘分布函数⚓︎

  • \(F_X(x) = P\{X \le x\} = F(x, +\infty)\)
  • \(F_Y(y) = P\{Y \le y\} = F(+\infty, y)\)

2. 边缘分布律 (离散型)⚓︎

  • 关于 \(X\) 的边缘分布律:\(P\{X = x_i\} = p_{i\cdot} = \sum_j p_{ij}\)
  • 关于 \(Y\) 的边缘分布律:\(P\{Y = y_j\} = p_{\cdot j} = \sum_i p_{ij}\)

3. 边缘概率密度 (连续型)⚓︎

  • 关于 \(X\) 的边缘密度:\(f_X(x) = \int_{-\infty}^{+\infty} f(x, y) \, \mathrm{d}y\)
  • 关于 \(Y\) 的边缘密度:\(f_Y(y) = \int_{-\infty}^{+\infty} f(x, y) \, \mathrm{d}x\)

4. 重要结论⚓︎

关键结论

  1. 联合分布唯一确定边缘分布,但边缘分布不能唯一确定联合分布(除非独立)

  2. 二维正态分布的边缘分布:若 \((X, Y) \sim N(\mu_1, \mu_2, \sigma_1^2, \sigma_2^2, \rho)\),则:

  3. \(X \sim N(\mu_1, \sigma_1^2)\)
  4. \(Y \sim N(\mu_2, \sigma_2^2)\)
  5. 即二维正态分布的边缘分布仍为正态分布,且与 \(\rho\) 无关

  6. 注意:边缘分布均为正态分布,联合分布不一定是二维正态分布


3.3 条件分布⚓︎

1. 离散型条件分布律⚓︎

\(Y = y_j\) 条件下 \(X\) 的条件分布律:

\[ P\{X = x_i | Y = y_j\} = \frac{P\{X = x_i, Y = y_j\}}{P\{Y = y_j\}} = \frac{p_{ij}}{p_{\cdot j}}, \quad (p_{\cdot j} > 0) \]

\(X = x_i\) 条件下 \(Y\) 的条件分布律:

\[ P\{Y = y_j | X = x_i\} = \frac{p_{ij}}{p_{i\cdot}}, \quad (p_{i\cdot} > 0) \]

2. 连续型条件概率密度⚓︎

\(Y = y\) 条件下 \(X\) 的条件概率密度:

\[ f_{X|Y}(x|y) = \frac{f(x, y)}{f_Y(y)}, \quad (f_Y(y) > 0) \]

\(X = x\) 条件下 \(Y\) 的条件概率密度:

\[ f_{Y|X}(y|x) = \frac{f(x, y)}{f_X(x)}, \quad (f_X(x) > 0) \]

条件分布函数

\[ F_{X|Y}(x|y) = \int_{-\infty}^x f_{X|Y}(u|y) \, \mathrm{d}u \]

3. 应用扩展⚓︎

条件概率可用于处理分阶段试验或已知部分信息更新概率的问题(类似全概率公式与贝叶斯公式的思想)。


3.4 相互独立的随机变量⚓︎

1. 独立性的定义⚓︎

独立性定义

一般定义:若对于所有的 \(x, y\),有 \(F(x, y) = F_X(x) F_Y(y)\),则称 \(X\)\(Y\) 相互独立

离散型充要条件:对于任意 \((x_i, y_j)\),有 \(p_{ij} = p_{i\cdot} p_{\cdot j}\)

连续型充要条件:在 \(f(x, y)\) 的连续点处,有 \(f(x, y) = f_X(x) f_Y(y)\)

2. 重要性质与结论⚓︎

独立性的重要性质

  1. 边缘确定联合:若 \(X, Y\) 独立,则联合分布可由边缘分布唯一确定

  2. 函数的独立性:若 \(X, Y\) 独立,\(h, g\) 是连续函数,则 \(h(X)\)\(g(Y)\) 也相互独立

  3. 二维正态分布的独立性:若 \((X, Y)\) 服从二维正态分布,则 \(X\)\(Y\) 相互独立的 充要条件是 \(\rho = 0\)

    注:对于一般分布,不相关 (\(\rho=0\)) 不一定独立;但对于二维正态分布,不相关 ⟺ 独立

  4. 条件密度与独立性:若 \(X, Y\) 独立,则条件密度等于无条件密度,即 \(f_{X|Y}(x|y) = f_X(x)\)


3.5 两个随机变量函数的分布⚓︎

1. 分布函数法 (通用方法)⚓︎

\(Z = g(X, Y)\),求 \(Z\) 的分布。

步骤

  1. 求分布函数:
\[ F_Z(z) = P\{Z \le z\} = P\{g(X, Y) \le z\} = \iint_{g(x,y) \le z} f(x, y) \, \mathrm{d}x \mathrm{d}y \]
  1. 求密度函数:
\[ f_Z(z) = F_Z'(z) \]

2. 和的分布 (\(Z = X + Y\))⚓︎

卷积公式

\(X, Y\) 独立,则 \(Z = X + Y\) 的概率密度为:

\[ f_Z(z) = \int_{-\infty}^{+\infty} f_X(x) f_Y(z - x) \, \mathrm{d}x = \int_{-\infty}^{+\infty} f_X(z - y) f_Y(y) \, \mathrm{d}y \]

记为 \(f_Z = f_X * f_Y\)

重要结论

  1. 正态分布的可加性:若 \(X \sim N(\mu_1, \sigma_1^2), Y \sim N(\mu_2, \sigma_2^2)\) 且独立,则: $$ X + Y \sim N(\mu_1 + \mu_2, \sigma_1^2 + \sigma_2^2) $$ 有限个独立正态变量的线性组合仍服从正态分布

  2. 泊松分布的可加性:若 \(X \sim \pi(\lambda_1), Y \sim \pi(\lambda_2)\) 且独立,则: $$ X + Y \sim \pi(\lambda_1 + \lambda_2) $$

3. 商的分布 (\(Z = X / Y\))⚓︎

密度函数公式(若 \(X, Y\) 独立):

\[ f_Z(z) = \int_{-\infty}^{+\infty} |y| f_X(zy) f_Y(y) \, \mathrm{d}y \]

4. 最大值与最小值的分布⚓︎

\(X, Y\) 独立,分布函数分别为 \(F_X(x), F_Y(y)\)

最值分布公式

最大值 \(M = \max\{X, Y\}\)

\[ F_M(z) = F_X(z) F_Y(z) \]

最小值 \(N = \min\{X, Y\}\)

\[ F_N(z) = 1 - [1 - F_X(z)][1 - F_Y(z)] \]

推广到 \(n\) 个独立同分布变量

\(X_i \sim F(x)\),则:

  • \(F_{\max}(z) = [F(z)]^n\)
  • \(F_{\min}(z) = 1 - [1 - F(z)]^n\)

5. 特殊分布扩展⚓︎

  • \(\chi^2\) 分布:设 \(X_1, \dots, X_n\) 相互独立且均服从 \(N(0, 1)\),则 \(Y = \sum_{i=1}^n X_i^2\) 服从自由度为 \(n\)\(\chi^2\) 分布

  • 瑞利分布:若 \(X, Y\) 独立同分布于 \(N(0, \sigma^2)\),则 \(Z = \sqrt{X^2 + Y^2}\) 服从参数为 \(\sigma\) 的瑞利分布


3.6 随机变量函数的联合分布⚓︎

1. 变量变换法 (Jacobian)⚓︎

\((X_1, X_2)\) 联合密度为 \(f_{X_1, X_2}(x_1, x_2)\),变换 \(Y_1 = g_1(X_1, X_2), Y_2 = g_2(X_1, X_2)\) 满足:

  1. 存在唯一反函数 \(x_1 = h_1(y_1, y_2), x_2 = h_2(y_1, y_2)\)
  2. 函数具有连续偏导数,且 Jacobian 行列式 \(J = \frac{\partial(g_1, g_2)}{\partial(x_1, x_2)} \neq 0\)

\((Y_1, Y_2)\) 的联合密度为:

\[ f_{Y_1, Y_2}(y_1, y_2) = f_{X_1, X_2}(x_1, x_2) \cdot |J|^{-1} \]

其中 \(x_1, x_2\) 需用 \(y_1, y_2\) 代入。


3.7 \(n\) 维随机变量简介⚓︎

1. 基本定义推广⚓︎

  • 联合分布函数\(F(x_1, \dots, x_n) = P\{X_1 \le x_1, \dots, X_n \le x_n\}\)
  • 联合概率密度\(f(x_1, \dots, x_n)\),满足非负性与归一性 (\(\int \dots \int f = 1\))
  • 边缘分布\(k\) 维边缘分布是通过对其余 \(n-k\) 个变量积分(连续型)或求和(离散型)得到

2. \(n\) 维独立性⚓︎

  • \(X_1, \dots, X_n\) 相互独立 \(\iff F(x_1, \dots, x_n) = \prod_{i=1}^n F_{X_i}(x_i)\)
  • 连续型充要条件:\(f(x_1, \dots, x_n) = \prod_{i=1}^n f_{X_i}(x_i)\)

3. 重要结论⚓︎

  • 正态变量之和:独立正态变量的和仍服从正态分布,参数为均值相加、方差相加

  • 最大值与最小值分布

  • \(F_{\max}(z) = \prod_{i=1}^n F_i(z)\)
  • \(F_{\min}(z) = 1 - \prod_{i=1}^n [1 - F_i(z)]\)

难点与易错点提示⚓︎

易错点警示

  1. 联合与边缘的关系:联合分布包含的信息量最大,可以推导边缘和条件分布;但仅知边缘分布通常无法恢复联合分布(除非已知独立)

  2. 积分区域的确定:在计算连续型随机变量函数的分布(如卷积公式、分布函数法)时,正确画出积分区域 \(G\) 并确定积分上下限是难点

  3. 独立性与不相关:一般情况下,独立 \(\Rightarrow\) 不相关,但不相关 \(\nRightarrow\) 独立。 例外:二维正态分布中,独立 \(\iff\) 不相关 (\(\rho=0\))

  4. 条件概率密度定义域:计算条件密度 \(f_{X|Y}(x|y)\) 时,需注意 \(f_Y(y) > 0\) 的条件,且结果仅在联合密度的非零区域内有效

  5. 变量变换的 Jacobian:在使用变换法求联合分布时,勿忘乘以 Jacobian 行列式的绝对值,且需将原变量用新变量表示后代入原密度函数


核心要点回顾

  1. 联合分布函数\(F(x,y) = P\{X \le x, Y \le y\}\),矩形域概率用四角公式
  2. 边缘分布:离散型求和,连续型积分
  3. 独立性\(F(x,y) = F_X(x)F_Y(y)\),二维正态中独立 ⟺ \(\rho=0\)
  4. 卷积公式\(f_Z(z) = \int f_X(x)f_Y(z-x)dx\)
  5. 最值分布:最大值乘积,最小值补集乘积
  6. 变量变换:勿忘乘以 \(|J|^{-1}\)