跳转至

第4章 习题集 - 随机变量的数字特征⚓︎

约 3403 个字 预计阅读时间 11 分钟 总阅读量

本章核心

38 道习题覆盖期望、条件期望、方差、协方差全部考点,重点掌握指示变量法、全期望公式、条件方差公式等核心解题技巧。


4.1 随机变量的数学期望⚓︎


题目 1:射击技术评定(期望)⚓︎

考查思路:

  • 离散型随机变量数学期望的定义与应用。
  • 通过期望值比较随机变量的平均水平。

知识点:

  • 离散型期望公式:\(E(X) = \sum x_k p_k\)
  • 期望的实际意义(平均值)。

题目:

甲、乙两人进行打靶,所射中环数分别记为 \(X_1, X_2\),它们的分布律分别为:

\(X_1\) 8 9 10
\(p_k\) 0.3 0.1 0.6
\(X_2\) 8 9 10
\(p_k\) 0.2 0.5 0.3

试评定他们射击技术的好坏。

解答:

计算甲的平均环数:

\[E(X_1) = 8 \times 0.3 + 9 \times 0.1 + 10 \times 0.6 = 2.4 + 0.9 + 6.0 = 9.3\]

计算乙的平均环数:

\[E(X_2) = 8 \times 0.2 + 9 \times 0.5 + 10 \times 0.3 = 1.6 + 4.5 + 3.0 = 9.1\]

结论:因为 \(E(X_1) > E(X_2)\),平均起来甲每枪射中 9.3 环,乙射中 9.1 环,因此甲的技术要好些。


题目 2:掷骰子点数期望⚓︎

考查思路:

  • 古典概型下的离散型期望计算。

知识点:

  • 均匀分布的离散型期望。

题目:

\(X\) 为投掷一颗骰子时出现的点数,求 \(X\) 的数学期望。

解答:

\(X\) 的分布律为 \(P\{X=i\} = 1/6, i=1, 2, ..., 6\)

\[E(X) = \sum_{i=1}^{6} i \cdot \frac{1}{6} = \frac{1}{6}(1+2+3+4+5+6) = \frac{21}{6} = 3.5\]

题目 3:柯西分布的期望存在性⚓︎

考查思路:

  • 数学期望存在的充要条件(绝对收敛)。
  • 广义积分的发散性判断。

知识点:

  • \(\int_{-\infty}^{+\infty} |x|f(x)dx\) 发散,则期望不存在。

题目:

\(X\) 服从柯西分布,其密度为 \(f(x) = \frac{1}{\pi(1+x^2)}, -\infty < x < +\infty\)。判断 \(X\) 的数学期望是否存在。

解答:

考察积分 \(\int_{-\infty}^{+\infty} |x| f(x) dx\)

\[\int_{-\infty}^{+\infty} \frac{|x|}{\pi(1+x^2)} dx = \frac{2}{\pi} \int_{0}^{+\infty} \frac{x}{1+x^2} dx = \frac{1}{\pi} [\ln(1+x^2)]_{0}^{+\infty} = +\infty\]

结论:由于积分发散,柯西分布的数学期望不存在。


题目 4:拉普拉斯分布的期望⚓︎

考查思路:

  • 连续型随机变量期望的计算。
  • 利用函数的奇偶性简化积分。

知识点:

  • 连续型期望公式:\(E(X) = \int_{-\infty}^{+\infty} x f(x) dx\)

题目:

\(X\) 的概率密度为 \(f(x) = \frac{1}{2}e^{-|x|}, -\infty < x < +\infty\),求 \(E(X)\)

解答:

\[E(X) = \int_{-\infty}^{+\infty} x \cdot \frac{1}{2}e^{-|x|} dx\]

由于被积函数 \(x e^{-|x|}\) 是奇函数,积分区间对称,故:

\[E(X) = 0\]

题目 5:标准正态变量平方的期望⚓︎

考查思路:

  • 随机变量函数的期望公式。
  • 分部积分法或利用方差公式间接求解。

知识点:

  • \(E(g(X)) = \int g(x)f(x)dx\)
  • \(D(X) = E(X^2) - [E(X)]^2\)

题目:

\(X \sim N(0, 1)\),求 \(E(X^2)\)

解答:

方法一(直接积分)

\[E(X^2) = \int_{-\infty}^{+\infty} x^2 \frac{1}{\sqrt{2\pi}} e^{-x^2/2} dx = 1\]

方法二(利用方差)

已知 \(X \sim N(0, 1)\),则 \(E(X)=0, D(X)=1\)

\(D(X) = E(X^2) - [E(X)]^2\),得 \(1 = E(X^2) - 0\),故 \(E(X^2) = 1\)


题目 6:库存优化问题(均匀分布)⚓︎

考查思路:

  • 期望在实际决策中的应用。
  • 分段函数的期望计算及极值求解。

知识点:

  • 均匀分布密度函数。
  • 利润函数的期望最大化。

题目:

某商品的市场需求量 \(X\) 服从 \([2000, 4000]\) 上的均匀分布,每售出一吨挣 3 万元,售不出则每吨需保养费 1 万元。问应组织多少货源才能使收益最大?

解答:

设进货量为 \(y\) (\(2000 \le y \le 4000\)),收益为 \(Z\)

\[Z = H(X) = \begin{cases} 3y, & X \ge y \\ 3X - (y-X), & X < y \end{cases} = \begin{cases} 3y, & X \ge y \\ 4X - y, & X < y \end{cases}\]

\(X\) 的密度为 \(f(x) = \frac{1}{2000}, 2000 \le x \le 4000\)

期望收益:

\[E(Z) = \int_{2000}^{y} (4x-y)\frac{1}{2000} dx + \int_{y}^{4000} 3y \frac{1}{2000} dx\]

计算得:

\[E(Z) = \frac{1}{1000} [-y^2 + 7000y - 4 \times 10^6]\]

\(y\) 求导并令为 0,解得 \(y = 3500\)

结论:组织 3500 吨货源是最好的决策。


题目 7:二维随机变量函数的期望⚓︎

考查思路:

  • 二维连续型随机变量函数的期望公式。

知识点:

  • \(E[g(X,Y)] = \iint g(x,y)f(x,y) dx dy\)

题目:

设二维随机变量 \((X,Y)\) 的概率密度为 \(f(x,y) = \begin{cases} x+y, & 0 \le x \le 1, 0 \le y \le 1 \\ 0, & \text{其它} \end{cases}\),求 \(E(XY)\)

解答:

\[E(XY) = \int_{0}^{1} \int_{0}^{1} xy (x+y) dx dy = \int_{0}^{1} \int_{0}^{1} (x^2y + xy^2) dx dy\]
\[= \int_{0}^{1} \left[ \frac{1}{3}x^3y + \frac{1}{2}x^2y^2 \right]_{0}^{1} dy = \int_{0}^{1} (\frac{1}{3}y + \frac{1}{2}y^2) dy = \left[ \frac{1}{6}y^2 + \frac{1}{6}y^3 \right]_{0}^{1} = \frac{1}{3}\]

题目 8:二项分布期望的分解法⚓︎

考查思路:

  • 利用期望的线性性质简化复杂分布的期望计算。
  • 引入指示变量(Indicator Variables)。

知识点:

  • \(E(\sum X_i) = \sum E(X_i)\)
  • 0-1 分布期望为 \(p\)

题目:

\(X \sim B(n, p)\),利用分解法求期望 \(E(X)\)

解答:

引入随机变量 \(X_i (i=1, ..., n)\),表示第 \(i\) 次试验结果(发生为 1,不发生为 0)。

\(X_i \sim (0-1)\) 分布,\(E(X_i) = p\)

\(X = \sum_{i=1}^{n} X_i\)

由期望线性性质:

\[E(X) = \sum_{i=1}^{n} E(X_i) = \sum_{i=1}^{n} p = np\]

题目 9:民航客车停车次数期望⚓︎

考查思路:

  • 复杂背景下的期望计算。
  • 指示变量法的典型应用。

知识点:

  • 对立事件概率。
  • 期望线性性质(不要求独立性)。

题目:

一民航送客车载有 20 位旅客,有 10 个车站可以下车。如到达一个车站没有旅客下车就不停车。设每位旅客在各个车站下车是等可能的,并设各旅客是否下车相互独立。以 \(X\) 表示停车的次数,求 \(E(X)\)

解答:

引入指示变量 \(X_i (i=1, ..., 10)\)

\[X_i = \begin{cases} 1, & \text{第 } i \text{ 站有人下车} \\ 0, & \text{第 } i \text{ 站无人下车} \end{cases}\]

\(X = \sum_{i=1}^{10} X_i\)

任一旅客在第 \(i\) 站不下车的概率为 \(0.9\),20 位旅客都不在第 \(i\) 站下车的概率为 \(0.9^{20}\)

\(P(X_i=1) = 1 - 0.9^{20}\)\(E(X_i) = 1 - 0.9^{20}\)

\[E(X) = \sum_{i=1}^{10} E(X_i) = 10 \times (1 - 0.9^{20}) \approx 8.78\]

4.2 条件期望⚓︎


题目 10:二项分布的条件期望⚓︎

考查思路:

  • 条件分布的推导。
  • 超几何分布的期望。

知识点:

  • 条件概率公式。
  • 对称性在期望计算中的应用。

题目:

\(X\)\(Y\) 是独立同分布的二项分布随机变量,参数为 \((n, p)\)。计算在 \(X+Y=m\) 的条件下 \(X\) 的条件期望 \(E(X | X+Y=m)\)

解答:

首先计算条件分布列,可证在给定 \(X+Y=m\) 条件下,\(X\) 服从超几何分布。

利用对称性:

\[E(X | X+Y=m) = E(Y | X+Y=m)\]

\(E(X+Y | X+Y=m) = m\),故:

\[2E(X | X+Y=m) = m \implies E(X | X+Y=m) = \frac{m}{2}\]

题目 11:矿工迷宫问题(递归期望)⚓︎

考查思路:

  • 全期望公式的应用。
  • 建立递归方程求解期望。

知识点:

  • \(E(X) = \sum E(X|Y=y_i)P(Y=y_i)\)
  • 递归思想。

题目:

矿工在有三道门的迷宫中,第一道门走 3 小时出迷宫,第二道门走 5 小时回原处,第三道门走 7 小时回原处。假设等可能选择。求出迷宫所需时间 \(X\) 的期望。

解答:

\(X\) 为出迷宫所需时间,\(Y\) 为选择的门号。

\[E(X) = \frac{1}{3}E(X|Y=1) + \frac{1}{3}E(X|Y=2) + \frac{1}{3}E(X|Y=3)\]

其中:

  • \(E(X|Y=1) = 3\)
  • \(E(X|Y=2) = 5 + E(X)\) (回到原地,期望不变)
  • \(E(X|Y=3) = 7 + E(X)\)

代入方程:

\[E(X) = \frac{1}{3}(3 + 5 + E(X) + 7 + E(X))\]
\[3E(X) = 15 + 2E(X) \implies E(X) = 15 \text{ 小时}\]

题目 12:随机营业额的期望⚓︎

考查思路:

  • 随机个随机变量之和的期望(Wald 等式)。
  • 条件期望的性质。

知识点:

  • \(E(\sum_{i=1}^{N} X_i) = E(N)E(X)\) (当 \(N\)\(X_i\) 独立时)。

题目:

某日进店人数 \(N\) 均值为 50,每人消费 \(X\) 均值为 8 元,且人数与消费额独立。求总营业额的期望。

解答:

设总营业额 \(S = \sum_{i=1}^{N} X_i\)

利用条件期望:

\[E(S) = E[E(S|N)] = E[N \cdot E(X)] = E(N)E(X)\]
\[E(S) = 50 \times 8 = 400 \text{ 元}\]

题目 13:均匀随机数和超过 1 的个数期望⚓︎

考查思路:

  • 连续型全期望公式。
  • 积分方程的求解。

知识点:

  • \(m(x) = 1 + \int_{0}^{x} m(x-y) dy\)

题目:

要在 (0,1) 区间上取多少个随机数,其和才能超过 1?求个数 \(N\) 的期望。

解答:

\(m(x)\) 为和超过 \(x\) 所需的期望个数。对第一个数 \(y\) 取条件:

\[m(x) = 1 + \int_{0}^{x} m(x-y) dy\]

求导得 \(m'(x) = m(x)\),且 \(m(0)=1\)

解得 \(m(x) = e^x\)

\(x=1\) 时,\(E(N) = m(1) = e \approx 2.718\)


题目 14:掷骰子"Craps"游戏期望⚓︎

考查思路:

  • 复杂博弈过程中的期望计算。
  • 几何分布与条件期望结合。

知识点:

  • 全期望公式。
  • 几何分布期望 \(1/p\)

题目:

掷两枚骰子,若点数和为 7 或 11 则赢,2, 3, 12 则输。若为其他点数 \(i\),则继续掷直到出现 7 或 \(i\)。若先出现 \(i\) 则赢,先出现 7 则输。求掷骰子次数 \(R\) 的期望。

解答:

\(S\) 为第一次掷出点数。

\[E(R) = \sum_{i} E(R|S=i)P(S=i)\]

\(i \in \{7, 11\}\)\(\{2, 3, 12\}\)\(R=1\)

\(i \in \{4,5,6,8,9,10\}\),需继续掷,直到出现 \(i\) 或 7。这服从几何分布,参数 \(p_i = P(i) + P(7)\)

期望次数为 \(1 + \frac{1}{p_i}\)(含第一次)。

综合计算得 \(E(R) \approx 3.376\)


题目 15:赌徒破产问题(平均局数)⚓︎

考查思路:

  • 随机游动模型。
  • 差分方程与边界条件。

知识点:

  • 条件期望建立递推关系。
  • 数学归纳法。

题目:

假设有 \(r\) 个玩家在赌博,玩家 \(i\) 最初拥有 \(n_i\) 单位赌资。每局两名玩家玩,赢家从输家赢得 1 单位。当玩家财富为 0 时淘汰,直到只有一名玩家拥有所有赌资 \(n = \sum n_i\)。求平均赌博局数。

解答:

先考虑 2 名玩家情况,赌资分别为 \(j\)\(n-j\)。设期望局数为 \(m_j\)

\[m_j = 1 + \frac{1}{2}m_{j+1} + \frac{1}{2}m_{j-1}\]

边界条件 \(m_0 = m_n = 0\)

解得 \(m_j = j(n-j)\)

对于 \(r\) 名玩家,总期望局数为:

\[E(X) = \frac{1}{2} \left( n^2 - \sum_{i=1}^{r} n_i^2 \right)\]

题目 16:最优奖问题(秘书问题)⚓︎

考查思路:

  • 最优停止理论。
  • 概率最大化策略。

知识点:

  • 条件概率。
  • 近似计算与极值求解。

题目:

设有 \(n\) 个不同的奖陆续出台,当一个奖出来时,你可以拒绝或接受。目标是得到最高奖。假设出台的奖项的 \(n!\) 种次序都是等可能的。求最优策略及得到最高奖的概率。

解答:

策略:拒绝前 \(k\) 个奖项,从第 \(k+1\) 个开始,一旦发现比前面所有都好的就接受。

得到最优奖的概率近似为:

\[P_k \approx \frac{k}{n} \int_{k/n}^{1} \frac{1}{x} dx = -\frac{k}{n} \ln(\frac{k}{n})\]

\(x = k/n\),求 \(g(x) = -x \ln x\) 的最大值。

\(x = 1/e\),即 \(k \approx n/e\)

此时最大概率 \(P \approx 1/e \approx 0.368\)


题目 17:Beta-Binomial 混合分布⚓︎

考查思路:

  • 连续型参数与离散型分布的混合。
  • 全概率公式的积分形式。

知识点:

  • \(\int_{0}^{1} p^i (1-p)^{n-i} dp = \frac{i!(n-i)!}{(n+1)!}\)

题目:

\(U\) 为 (0,1) 上均匀分布的随机变量,又设在给定 \(U=p\) 的条件下,随机变量 \(X\) 服从参数为 \((n, p)\) 的二项分布,计算 \(X\) 的分布列。

解答:

\[P(X=i) = \int_{0}^{1} P(X=i|U=p) f_U(p) dp = \int_{0}^{1} C_n^i p^i (1-p)^{n-i} \cdot 1 dp\]

利用 Beta 函数性质:

\[P(X=i) = C_n^i \frac{i!(n-i)!}{(n+1)!} = \frac{1}{n+1}, \quad i=0, 1, ..., n\]

结论\(X\) 服从 \(\{0, 1, ..., n\}\) 上的均匀分布。


4.3 方差与切比雪夫不等式⚓︎


题目 18:射击技术评定(方差)⚓︎

考查思路:

  • 方差的计算及稳定性比较。
  • 期望相同情况下,方差越小越稳定。

知识点:

  • \(D(X) = E(X^2) - [E(X)]^2\)

题目:

接题目 1,甲、乙两人射击环数分布律已知,计算方差并评定稳定性。

解答:

甲的方差:

\[D(X_1) = E(X_1^2) - 9.3^2 = (64\times0.3 + 81\times0.1 + 100\times0.6) - 86.49 = 87.3 - 86.49 = 0.81\]

(注:根据提供的 PDF 文本计算结果略有差异,文本中甲方差约为 1.11,乙方差约为 0.49,此处以文本结论为准)

文本结论:甲方差较大,技术不够"稳定";乙方差小,较"稳定"。


题目 19:三角分布的方差⚓︎

考查思路:

  • 连续型变量方差计算。
  • 分段积分。

知识点:

  • 方差计算公式。

题目:

设随机变量 \(X\) 具有概率密度 \(f(x) = \begin{cases} 1+x, & -1 \le x < 0 \\ 1-x, & 0 \le x < 1 \\ 0, & \text{其它} \end{cases}\),求 \(D(X)\)

解答:

由对称性知 \(E(X) = 0\)

\[E(X^2) = \int_{-1}^{0} x^2(1+x) dx + \int_{0}^{1} x^2(1-x) dx = \frac{1}{6}\]
\[D(X) = E(X^2) - [E(X)]^2 = \frac{1}{6}\]

题目 20:几何分布的方差(条件期望法)⚓︎

考查思路:

  • 利用条件期望求二阶矩。
  • 递归思想求方差。

知识点:

  • \(Var(N) = E(N^2) - [E(N)]^2\)
  • 条件方差公式或条件期望求矩。

题目:

设有一独立重复试验序列,每次试验成功的概率为 \(p\),记 \(N\) 为取得第一次成功所需的试验次数。求 \(Var(N)\)

解答:

利用条件期望求 \(E(N^2)\)。设 \(Y=1\) 表示第一次成功,\(Y=0\) 表示失败。

\[E(N^2|Y=1) = 1\]
\[E(N^2|Y=0) = E((1+N)^2) = 1 + 2E(N) + E(N^2)\]

由全期望公式:

\[E(N^2) = p \cdot 1 + (1-p)[1 + 2E(N) + E(N^2)]\]

已知 \(E(N) = 1/p\),解得 \(E(N^2) = \frac{2-p}{p^2}\)

\[Var(N) = \frac{2-p}{p^2} - \frac{1}{p^2} = \frac{1-p}{p^2}\]

题目 21:对数正态分布的期望与方差⚓︎

考查思路:

  • 变量代换积分。
  • 正态分布矩的性质。

知识点:

  • \(\ln X \sim N(\mu, \sigma^2)\),则 \(X\) 服从对数正态分布。

题目:

\(X\) 有密度函数 \(f(x) = \frac{1}{x\sigma\sqrt{2\pi}} \exp\{-\frac{(\ln x - \mu)^2}{2\sigma^2}\}, x>0\)。求 \(E(X), D(X)\)

解答:

\(y = \ln x\),则 \(y \sim N(\mu, \sigma^2)\)\(x = e^y\)

\[E(X) = E(e^y) = \text{MGF}_y(1) = e^{\mu + \sigma^2/2}\]
\[E(X^2) = E(e^{2y}) = \text{MGF}_y(2) = e^{2\mu + 2\sigma^2}\]
\[D(X) = E(X^2) - [E(X)]^2 = e^{2\mu + \sigma^2}(e^{\sigma^2} - 1)\]

题目 22:切比雪夫不等式估算⚓︎

考查思路:

  • 利用切比雪夫不等式估计概率界限。
  • 不需要知道具体分布。

知识点:

  • \(P(|X - \mu| \ge \epsilon) \le \frac{\sigma^2}{\epsilon^2}\)

题目:

已知 \(E(X)=100, D(X)=10\)。估算 \(P(80 < X < 120)\) 的下界。

解答:

\[P(80 < X < 120) = P(|X-100| < 20) = 1 - P(|X-100| \ge 20)\]

由切比雪夫不等式:

\[P(|X-100| \ge 20) \le \frac{10}{20^2} = 0.025\]

\(P(80 < X < 120) \ge 1 - 0.025 = 0.975\)


题目 23:标准化随机变量证明⚓︎

考查思路:

  • 期望与方差的线性性质。
  • 标准化的定义。

知识点:

  • \(X^* = \frac{X - E(X)}{\sqrt{D(X)}}\)

题目:

证明随机变量 \(X^* = \frac{X - E(X)}{\sqrt{D(X)}}\) 的期望为 0,方差为 1。

解答:

\(\mu=E(X), \sigma^2=D(X)\)

\[E(X^*) = \frac{1}{\sigma} E(X - \mu) = \frac{1}{\sigma} (\mu - \mu) = 0\]
\[D(X^*) = \frac{1}{\sigma^2} D(X - \mu) = \frac{1}{\sigma^2} D(X) = 1\]

4.4 条件方差⚓︎


题目 24:火车站旅客人数方差⚓︎

考查思路:

  • 条件方差公式的应用。
  • 泊松过程与均匀分布的结合。

知识点:

  • \(Var(X) = E[Var(X|Y)] + Var[E(X|Y)]\)

题目:

在 (0, T) 内到达某火车站的人数是一个泊松随机变量,均值为 \(\lambda t\)。现设火车在 (0,T) 这个区间内随机到达(均匀分布),且与旅客到达时间独立。求火车到达时,上火车的旅客人数的期望和方差。

解答:

\(Y\) 为火车到达时间,\(N(Y)\) 为人数。

给定 \(Y=t\)\(N(t) \sim Poisson(\lambda t)\)

\(E[N(Y)|Y=t] = \lambda t\)\(Var[N(Y)|Y=t] = \lambda t\)

期望:

\[E[N(Y)] = E[E[N(Y)|Y]] = E[\lambda Y] = \lambda \frac{T}{2}\]

方差:

\[Var[N(Y)] = E[Var(N(Y)|Y)] + Var[E(N(Y)|Y)]\]
\[= E[\lambda Y] + Var[\lambda Y] = \lambda \frac{T}{2} + \lambda^2 \frac{T^2}{12}\]

题目 25:随机个数随机变量之和的方差⚓︎

考查思路:

  • 随机和的方差公式推导。
  • 条件方差公式的直接应用。

知识点:

  • \(Var(\sum_{i=1}^{N} X_i) = E(N)Var(X) + [E(X)]^2 Var(N)\)

题目:

\(X_i\) 是一系列独立同分布的随机变量,\(N\) 是一取非负整数的随机变量,并且独立于序列 \(X_i\)。计算 \(Var(\sum_{i=1}^{N} X_i)\)

解答:

\(S_N = \sum_{i=1}^{N} X_i\)

\[Var(S_N) = E[Var(S_N|N)] + Var[E(S_N|N)]\]

给定 \(N=n\)\(Var(S_N|N=n) = n Var(X)\)\(E(S_N|N=n) = n E(X)\)

\[Var(S_N) = E[N Var(X)] + Var[N E(X)]\]
\[= E(N)Var(X) + [E(X)]^2 Var(N)\]

4.5 条件期望及预测⚓︎


题目 26:身高预测问题⚓︎

考查思路:

  • 条件期望作为最优预测值。
  • 线性回归模型的预测。

知识点:

  • 最小均方误差准则下,最优预测为条件期望。

题目:

设父亲的身高为 \(X\) 英寸,儿子的身高服从均值为 \(X+1\) 的正态分布。假设父亲的身高为 6 英尺(72 英寸),那么其儿子成年以后的身高的最优预测值是多少?

解答:

最优预测值为 \(E(Y | X=72)\)

已知 \(E(Y|X) = X + 1\)

\[E(Y | X=72) = 72 + 1 = 73 \text{ 英寸}\]

题目 27:最优线性预测⚓︎

考查思路:

  • 当联合分布未知时,利用矩信息求最优线性预测。
  • 最小二乘法原理。

知识点:

  • 线性预测 \(a+bX\) 的系数求解。
  • 相关系数 \(\rho\) 的作用。

题目:

已知 \(X, Y\) 的期望、方差和相关系数,求 \(Y\) 关于 \(X\) 的最优线性预测 \(a+bX\)

解答:

最小化 \(E[(Y - (a+bX))^2]\)

解得:

\[b = \rho \frac{\sigma_Y}{\sigma_X}, \quad a = \mu_Y - b\mu_X\]

最优线性预测为:

\[\hat{Y} = \mu_Y + \rho \frac{\sigma_Y}{\sigma_X} (X - \mu_X)\]

均方误差为 \(\sigma_Y^2 (1 - \rho^2)\)


4.6 协方差和相关系数⚓︎


题目 28:二维正态分布的相关系数⚓︎

考查思路:

  • 二维正态分布密度函数参数的意义。
  • 协方差积分计算。

知识点:

  • 二维正态分布参数 \(\rho\) 即为相关系数。
  • 独立与不相关在正态分布下等价。

题目:

\((X, Y)\) 服从二维正态分布,求 \(X\)\(Y\) 的相关系数。

解答:

通过联合密度公式展开计算 \(Cov(X, Y) = E(XY) - E(X)E(Y)\)

积分计算可得 \(Cov(X, Y) = \rho \sigma_1 \sigma_2\)

故相关系数 \(\rho_{XY} = \frac{Cov(X, Y)}{\sigma_1 \sigma_2} = \rho\)

结论:二维正态分布中,\(\rho=0\) 是独立性的充要条件。


题目 29:线性组合的相关系数⚓︎

考查思路:

  • 协方差的线性运算性质。
  • 相关系数的定义计算。

知识点:

  • \(Cov(aX+bY, cX+dY)\) 展开公式。
  • 独立时协方差为 0。

题目:

已知 \(X \sim N(2003, 1), Y \sim N(2004, 1)\) 且独立。求 \(U = 3X-Y\)\(V = X+Y\) 的相关系数。

解答:

\[Cov(U, V) = Cov(3X-Y, X+Y) = 3D(X) + 3Cov(X,Y) - Cov(Y,X) - D(Y)\]

因独立,\(Cov(X,Y)=0\),且 \(D(X)=D(Y)=1\)

\[Cov(U, V) = 3(1) - 1 = 2\]
\[D(U) = 9D(X) + D(Y) = 10, \quad D(V) = D(X) + D(Y) = 2\]
\[\rho_{UV} = \frac{2}{\sqrt{10} \cdot \sqrt{2}} = \frac{2}{\sqrt{20}} = \frac{1}{\sqrt{5}} = \frac{\sqrt{5}}{5}\]

综合练习题⚓︎


题目 30:电子装置寿命(串联与并联)⚓︎

考查思路:

  • 极值分布(最小值与最大值)的期望。
  • 指数分布的无记忆性与性质。

知识点:

  • 串联寿命 \(Z = \min(X_i)\)
  • 并联寿命 \(Z = \max(X_i)\)

题目:

有 5 个相互独立工作的电子装置,它们的寿命 \(X_k\) 服从同一指数分布,密度为 \(f(x) = \frac{1}{\theta} e^{-x/\theta}, x>0\)

(i) 若将这个电子装置串联工作组成整机,求整机寿命的数学期望。

(ii) 若将这个电子装置并联工作组成整机,求整机寿命的数学期望。

解答:

(i) 串联:\(Z = \min(X_1, ..., X_5)\)\(Z\) 服从参数为 \(5/\theta\) 的指数分布(均值为 \(\theta/5\))。

\[E(Z) = \frac{\theta}{5}\]

(ii) 并联:\(Z = \max(X_1, ..., X_5)\)

利用期望公式 \(E(Z) = \int_{0}^{+\infty} [1 - F_Z(z)] dz\)

\[F_Z(z) = (1 - e^{-z/\theta})^5\]

计算得:

\[E(Z) = \theta (1 + \frac{1}{2} + \frac{1}{3} + \frac{1}{4} + \frac{1}{5}) = \frac{137}{60}\theta\]

题目 31:二维密度期望计算⚓︎

考查思路:

  • 二维连续型变量边缘期望计算。
  • 积分区域确定。

知识点:

  • \(E(X) = \iint x f(x,y) dx dy\)

题目:

设随机变量 \((X, Y)\) 的联合密度为 \(f(x, y) = \begin{cases} 1, & |y| < x, 0 < x < 1 \\ 0, & \text{其它} \end{cases}\),求 \(E(X), E(Y)\)

解答:

\[E(X) = \int_{0}^{1} \int_{-x}^{x} x \cdot 1 dy dx = \int_{0}^{1} 2x^2 dx = \frac{2}{3}\]
\[E(Y) = \int_{0}^{1} \int_{-x}^{x} y \cdot 1 dy dx = \int_{0}^{1} 0 dx = 0\]

(由对称性也可知 \(E(Y)=0\)


题目 32:球放入盒子(占有问题)⚓︎

考查思路:

  • 指示变量法处理占有问题。
  • 期望线性性质的强大应用。

知识点:

  • \(X = \sum X_i\)\(X_i\) 表示第 \(i\) 个盒子是否有球。

题目:

\(n\) 个编号为 1-n 的球随机放入 \(m\) 个盒子中去 (盒子容量不限),\(X\) 表示有球的盒子数,求 \(EX\)

解答:

\(X_i = 1\) 表示第 \(i\) 个盒子有球,否则为 0。\(X = \sum_{i=1}^{m} X_i\)

\(i\) 个盒子无球的概率为 \((\frac{m-1}{m})^n\)

\[P(X_i=1) = 1 - (\frac{m-1}{m})^n\]
\[E(X) = \sum_{i=1}^{m} E(X_i) = m [1 - (1 - \frac{1}{m})^n]\]

题目 33:正态分布绝对偏差期望⚓︎

考查思路:

  • 正态分布的性质。
  • 绝对值函数的积分。

知识点:

  • \(E|X-\mu|\) 的计算。

题目:

已知 \(X \sim N(\mu, \sigma^2)\),求 \(E|X-\mu|\)

解答:

\(Z = \frac{X-\mu}{\sigma} \sim N(0, 1)\)

\[E|X-\mu| = \sigma E|Z| = \sigma \int_{-\infty}^{+\infty} |z| \frac{1}{\sqrt{2\pi}} e^{-z^2/2} dz\]
\[= 2\sigma \int_{0}^{+\infty} z \frac{1}{\sqrt{2\pi}} e^{-z^2/2} dz = \sigma \sqrt{\frac{2}{\pi}}\]

题目 34:切比雪夫不等式证明(离散型)⚓︎

考查思路:

  • 不等式放缩技巧。
  • 概率求和与方差定义的联系。

知识点:

  • \(D(X) = \sum (x_k - \mu)^2 p_k\)

题目:

\(X\) 服从离散分布时,证明切比雪夫不等式 \(P(|X - \mu| \ge \epsilon) \le \frac{D(X)}{\epsilon^2}\)

解答:

\[D(X) = \sum_{k} (x_k - \mu)^2 p_k \ge \sum_{k: |x_k - \mu| \ge \epsilon} (x_k - \mu)^2 p_k\]
\[\ge \sum_{k: |x_k - \mu| \ge \epsilon} \epsilon^2 p_k = \epsilon^2 P(|X - \mu| \ge \epsilon)\]

移项即得证。


题目 35:二维密度相关系数计算(完整解答)⚓︎

已知 \((X, Y)\) 的联合密度函数为:

\[f(x, y) = \begin{cases} \frac{1}{8}(x+y), & 0 \le x \le 2, 0 \le y \le 2 \\ 0, & \text{其它} \end{cases}\]

求相关系数 \(\displaystyle \rho = \frac{Cov(X,Y)}{\sqrt{D(X)D(Y)}}\)


步骤 1:求边缘密度 \(f_X(x)\)\(f_Y(y)\)

由对称性,\(f_X(x) = f_Y(y)\),只需计算其一:

\[
\begin{aligned}
f_X(x) &= \int_0^2 f(x,y) \, dy = \int_0^2 \frac{1}{8}(x+y) \, dy \\
&= \frac{1}{8} \left[ xy + \frac{y^2}{2} \right]_0^2 = \frac{1}{8}(2x + 2) = \frac{x+1}{4}, \quad 0 \le x \le 2
\end{aligned}
\]

同理:\(f_Y(y) = \dfrac{y+1}{4}, \quad 0 \le y \le 2\)


步骤 2:求 \(E(X), E(X^2), D(X)\)\(Y\) 由对称性同理)

\[
\begin{aligned}
E(X) &= \int_0^2 x \cdot f_X(x) \, dx = \int_0^2 x \cdot \frac{x+1}{4} \, dx \\
&= \frac{1}{4} \int_0^2 (x^2 + x) \, dx = \frac{1}{4} \left[ \frac{x^3}{3} + \frac{x^2}{2} \right]_0^2 \\
&= \frac{1}{4} \left( \frac{8}{3} + 2 \right) = \frac{1}{4} \cdot \frac{14}{3} = \boxed{\frac{7}{6}}
\end{aligned}
\]

计算 \(E(X^2)\)

\[
\begin{aligned}
E(X^2) &= \int_0^2 x^2 \cdot \frac{x+1}{4} \, dx = \frac{1}{4} \int_0^2 (x^3 + x^2) \, dx \\
&= \frac{1}{4} \left[ \frac{x^4}{4} + \frac{x^3}{3} \right]_0^2 = \frac{1}{4} \left( 4 + \frac{8}{3} \right) = \frac{1}{4} \cdot \frac{20}{3} = \boxed{\frac{5}{3}}
\end{aligned}
\]

计算方差 \(D(X)\)

\[
D(X) = E(X^2) - [E(X)]^2 = \frac{5}{3} - \left( \frac{7}{6} \right)^2 = \frac{60}{36} - \frac{49}{36} = \boxed{\frac{11}{36}}
\]

由对称性:\(E(Y) = \dfrac{7}{6}, \quad D(Y) = \dfrac{11}{36}\)


步骤 3:求 \(E(XY)\)

\[
\begin{aligned}
E(XY) &= \iint_{[0,2]^2} xy \cdot f(x,y) \, dxdy = \frac{1}{8} \int_0^2 \int_0^2 xy(x+y) \, dxdy \\
&= \frac{1}{8} \int_0^2 \int_0^2 (x^2y + xy^2) \, dxdy
\end{aligned}
\]

先对 \(x\) 积分:

\[
\int_0^2 (x^2y + xy^2) \, dx = y \cdot \frac{8}{3} + y^2 \cdot 2 = \frac{8y}{3} + 2y^2
\]

再对 \(y\) 积分:

\[
\begin{aligned}
E(XY) &= \frac{1}{8} \int_0^2 \left( \frac{8y}{3} + 2y^2 \right) dy = \frac{1}{8} \left[ \frac{4y^2}{3} + \frac{2y^3}{3} \right]_0^2 \\
&= \frac{1}{8} \left( \frac{16}{3} + \frac{16}{3} \right) = \frac{1}{8} \cdot \frac{32}{3} = \boxed{\frac{4}{3}}
\end{aligned}
\]

步骤 4:计算协方差 \(Cov(X,Y)\)

\[
Cov(X,Y) = E(XY) - E(X)E(Y) = \frac{4}{3} - \frac{7}{6} \cdot \frac{7}{6} = \frac{48}{36} - \frac{49}{36} = \boxed{-\frac{1}{36}}
\]

步骤 5:计算相关系数 \(\rho\)

\[
\begin{aligned}
\rho &= \frac{Cov(X,Y)}{\sqrt{D(X)D(Y)}} = \frac{-\frac{1}{36}}{\sqrt{\frac{11}{36} \cdot \frac{11}{36}}} = \frac{-\frac{1}{36}}{\frac{11}{36}} = \boxed{-\frac{1}{11}}
\end{aligned}
\]

最终答案:

\[\boxed{\rho = -\dfrac{1}{11}}\]

题目 36:二维离散随机变量函数的期望(幂级数方法)⚓︎

考查思路:

  • 二维离散型随机变量函数期望的计算公式。
  • 双重求和的计算技巧(先对内层求和)。
  • 幂级数求导法求无穷级数和。
  • 几何级数及其导数的应用。

知识点:

  • 二维离散型期望公式:\(E[g(X,Y)] = \sum\sum g(x_i, y_j)P\{X=x_i, Y=y_j\}\)
  • 等差数列求和:\(\sum_{i=1}^{n} i = \frac{n(n+1)}{2}\)
  • 几何级数:\(\sum_{n=0}^{\infty} q^n = \frac{1}{1-q}\) (\(|q|<1\))。
  • 幂级数逐项求导技巧。

题目:

已知 \((X,Y)\) 的联合分布律为 \(P\{X=i, Y=j\} = p^2 q^{j-2}\),其中 \(i=1,2,\cdots,j-1\)\(j=2,3,\cdots\)\(0<p<1, q=1-p\)

求:(1) \(E(XY)\); (2) \(E(\frac{X}{Y})\)

解答:

(1) 计算 \(E(XY)\)

\[E(XY) = \sum_{j=2}^{\infty} \sum_{i=1}^{j-1} ij \cdot P\{X=i, Y=j\}\]

代入联合分布律:

\[= \sum_{j=2}^{\infty} \sum_{i=1}^{j-1} ij \cdot p^2 q^{j-2}\]

先对 \(i\) 求和(注意 \(j\)\(p^2 q^{j-2}\)\(i\) 是常数):

\[= \sum_{j=2}^{\infty} j \cdot p^2 q^{j-2} \cdot \sum_{i=1}^{j-1} i\]

利用等差数列求和公式 \(\sum_{i=1}^{n} i = \frac{n(n+1)}{2}\),这里 \(n=j-1\)

\[= \sum_{j=2}^{\infty} j \cdot p^2 q^{j-2} \cdot \frac{(j-1)j}{2}\]
\[= \frac{1}{2} p^2 \sum_{j=2}^{\infty} j^2(j-1) q^{j-2}\]
\[= \frac{1}{2} p^2 \sum_{j=2}^{\infty} (j^3 - j^2) q^{j-2}\]

利用幂级数求导法:

注意到 \(\sum_{j=2}^{\infty} q^j = \frac{q^2}{1-q}\),对其求导:

  • 一阶导:\((\sum q^j)' = \sum j q^{j-1}\)
  • 二阶导:\((\sum q^j)'' = \sum j(j-1) q^{j-2}\)
  • 三阶导:\((\sum q^j)''' = \sum j(j-1)(j-2) q^{j-3}\)

经过级数变换和求导运算(详细过程略):

\[= \frac{1}{2} p^2 \left[ \left(\sum_{j=2}^{\infty} q^{j+1}\right)''' - \left(\sum_{j=2}^{\infty} q^j\right)'' \right]\]
\[= \frac{1}{2} p^2 \left( \frac{6}{p^4} - \frac{2}{p^3} \right)\]
\[= \frac{1}{2} p^2 \cdot \frac{6-2p}{p^4} = \frac{3-p}{p^2} = \frac{2+q}{p^2}\]

(2) 计算 \(E(\frac{X}{Y})\)

\[E\left(\frac{X}{Y}\right) = \sum_{j=2}^{\infty} \sum_{i=1}^{j-1} \frac{i}{j} \cdot P\{X=i, Y=j\}\]
\[= \sum_{j=2}^{\infty} \sum_{i=1}^{j-1} \frac{i}{j} \cdot p^2 q^{j-2}\]

先对 \(i\) 求和:

\[= \sum_{j=2}^{\infty} \frac{1}{j} \cdot p^2 q^{j-2} \cdot \sum_{i=1}^{j-1} i\]
\[= \sum_{j=2}^{\infty} \frac{1}{j} \cdot p^2 q^{j-2} \cdot \frac{j(j-1)}{2}\]
\[= \frac{1}{2} p^2 \sum_{j=2}^{\infty} (j-1) q^{j-2}\]

利用幂级数求导:

\[= \frac{1}{2} p^2 \left( \sum_{j=2}^{\infty} q^{j-1} \right)'\]
\[= \frac{1}{2} p^2 \left( \frac{q}{1-q} \right)'\]

由于 \(q = 1-p\)\(\frac{q}{1-q} = \frac{1-p}{p} = \frac{1}{p} - 1\),对 \(q\) 求导:

\[= \frac{1}{2} p^2 \cdot \frac{1}{(1-q)^2} = \frac{1}{2} p^2 \cdot \frac{1}{p^2} = \frac{1}{2}\]

答案:

(1) \(E(XY) = \frac{2+q}{p^2}\)

(2) \(E\left(\frac{X}{Y}\right) = \frac{1}{2}\)


题目 37:信号强度的最优估计⚓︎

题目描述:

假设在 \(A\) 处发射一个强度为 \(s\) 的信号,在 \(B\) 处会接收到一个强度为 \(R\) 的信号,\(R\) 是一个正态随机变量,参数为 \((s, 1)\)。现在假设发射端发射的信号强度 \(S\) 服从正态分布,参数为 \((\mu, \sigma^2)\)。当接收端收到的 \(R\) 的值为 \(r\) 时,求发送信号强度的最优估计?

解答过程:

1. 计算条件密度

首先计算发射端发送信号强度 \(S\) 在给定 \(R\) 之下的条件密度。根据贝叶斯公式:

\[
f_{S|R}(s|r) = \frac{f_{S,R}(s,r)}{f_R(r)} = \frac{f_S(s)f_{R|S}(r|s)}{f_R(r)}
\]

由于分母 \(f_R(r)\)\(s\) 无关,我们可以将其归入常数项 \(K\)\(K\) 不依赖于 \(s\))。代入正态分布的概率密度函数公式:

\[
f_{S|R}(s|r) = K \cdot e^{-(s-\mu)^2/(2\sigma^2)} \cdot e^{-(r-s)^2/2}
\]

2. 指数部分配方

为了识别该分布的类型,我们需要对指数部分进行整理和配方。注意以下代数推导(其中 \(C_1, C_2\) 均不依赖于 \(s\)):

\[
\begin{aligned}
\frac{(s-\mu)^2}{2\sigma^2} + \frac{(r-s)^2}{2} &= s^2\left(\frac{1}{2\sigma^2} + \frac{1}{2}\right) - \left(\frac{\mu}{\sigma^2} + r\right)s + C_1 \\
&= \frac{1+\sigma^2}{2\sigma^2} \left[ s^2 - 2\left(\frac{\mu + r\sigma^2}{1+\sigma^2}\right)s \right] + C_1 \\
&= \frac{1+\sigma^2}{2\sigma^2} \left( s - \frac{\mu + r\sigma^2}{1+\sigma^2} \right)^2 + C_2
\end{aligned}
\]

3. 确定条件分布及其参数

将上述配方结果代回条件密度公式,得到:

\[
f_{S|R}(s|r) = C \exp\left\{ \frac{-\left(s - \frac{\mu + r\sigma^2}{1+\sigma^2}\right)^2}{2\left(\frac{\sigma^2}{1+\sigma^2}\right)} \right\}
\]

其中 \(C\)\(s\) 无关。由上式可知,在给定 \(R=r\) 下,\(S\) 的条件分布为正态分布

对比标准正态分布密度函数 \(e^{-\frac{(x-\mu')^2}{2\sigma'^2}}\),我们可以直接读出其期望和方差:

  • 条件期望:

$$ E(S|R=r) = \frac{\mu + r\sigma2}{1+\sigma2} $$

  • 条件方差:

$$ \text{Var}(S|R=r) = \frac{\sigma2}{1+\sigma2} $$

4. 最优估计结果

利用命题:在给定 \(R=r\) 之下,在均方误差最小 (MMSE) 的意义下,\(S\) 的最优估计即为条件期望 \(E(S|R=r)\)

我们将结果改写为加权平均的形式:

\[
\hat{S}_{opt} = E(S|R=r) = \frac{1}{1+\sigma^2}\mu + \frac{\sigma^2}{1+\sigma^2}r
\]

结果分析:

条件期望提供了关于 \(S\) 的信息。它是以下两项的加权平均:

  1. \(\mu\):信号的先验期望值
  2. \(r\):接收到信号的观测值(在此处可视作接收到信号的期望值)。

两个权值之比为 \(1 : \sigma^2\)

  • 其中 1 代表信号 \(s\) 发出后接收到的信号的条件方差(题目中 \(R \sim N(s, 1)\),方差为 1)。
  • \(\sigma^2\) 表示发送信号的方差(先验方差)。

这意味着,如果先验方差 \(\sigma^2\) 很大(即我们对发射信号很不了解),我们会更信任观测值 \(r\)(权重更大);反之,如果观测噪声很大(本题中固定为 1,若推广看),我们会更信任先验均值 \(\mu\)


题目 38:Gamma 分布的期望与方差⚓︎

题目:

设随机变量 \(X\) 服从参数为 \(\alpha\)\(\lambda\)\(\Gamma\) 分布,计算:

(a) 期望 \(E[X]\)

(b) 方差 \(Var(X)\)


1. 核心结论(直接记忆版)

  • 期望:$\(E[X] = \frac{\alpha}{\lambda}\)$

  • 方差:$\(Var(X) = \frac{\alpha}{\lambda^2}\)$


2. 简要推导思路

利用 Gamma 函数的性质:\(\Gamma(\alpha+1) = \alpha\Gamma(\alpha)\)

(a) 计算期望 \(E[X]\)

根据期望定义积分,通过凑项法,将积分部分凑成参数为 \(\alpha+1\) 的 Gamma 分布密度函数的核心部分:

\[
\begin{aligned}
E[X] &= \int_{0}^{\infty} x \cdot \frac{\lambda^{\alpha}}{\Gamma(\alpha)} x^{\alpha-1} e^{-\lambda x} dx \\
&= \frac{1}{\lambda} \cdot \frac{\Gamma(\alpha+1)}{\Gamma(\alpha)} \\
&= \frac{1}{\lambda} \cdot \alpha = \frac{\alpha}{\lambda}
\end{aligned}
\]

(b) 计算方差 \(Var(X)\)

先计算二阶矩 \(E[X^2]\)(同理利用 \(\Gamma(\alpha+2) = (\alpha+1)\alpha\Gamma(\alpha)\)):

\[ E[X^2] = \frac{\alpha(\alpha+1)}{\lambda^2} \]

利用方差公式 \(Var(X) = E[X^2] - (E[X])^2\)

\[
Var(X) = \frac{\alpha^2 + \alpha}{\lambda^2} - \left(\frac{\alpha}{\lambda}\right)^2 = \frac{\alpha}{\lambda^2}
\]