第4章 习题集 - 随机变量的数字特征⚓︎
约 3403 个字 预计阅读时间 11 分钟 总阅读量 次
本章核心
38 道习题覆盖期望、条件期望、方差、协方差全部考点,重点掌握指示变量法、全期望公式、条件方差公式等核心解题技巧。
4.1 随机变量的数学期望⚓︎
题目 1:射击技术评定(期望)⚓︎
考查思路:
- 离散型随机变量数学期望的定义与应用。
- 通过期望值比较随机变量的平均水平。
知识点:
- 离散型期望公式:\(E(X) = \sum x_k p_k\)。
- 期望的实际意义(平均值)。
题目:
甲、乙两人进行打靶,所射中环数分别记为 \(X_1, X_2\),它们的分布律分别为:
| \(X_1\) | 8 | 9 | 10 |
|---|---|---|---|
| \(p_k\) | 0.3 | 0.1 | 0.6 |
| \(X_2\) | 8 | 9 | 10 |
|---|---|---|---|
| \(p_k\) | 0.2 | 0.5 | 0.3 |
试评定他们射击技术的好坏。
解答:
计算甲的平均环数:
\[E(X_1) = 8 \times 0.3 + 9 \times 0.1 + 10 \times 0.6 = 2.4 + 0.9 + 6.0 = 9.3\]
计算乙的平均环数:
\[E(X_2) = 8 \times 0.2 + 9 \times 0.5 + 10 \times 0.3 = 1.6 + 4.5 + 3.0 = 9.1\]
结论:因为 \(E(X_1) > E(X_2)\),平均起来甲每枪射中 9.3 环,乙射中 9.1 环,因此甲的技术要好些。
题目 2:掷骰子点数期望⚓︎
考查思路:
- 古典概型下的离散型期望计算。
知识点:
- 均匀分布的离散型期望。
题目:
设 \(X\) 为投掷一颗骰子时出现的点数,求 \(X\) 的数学期望。
解答:
\(X\) 的分布律为 \(P\{X=i\} = 1/6, i=1, 2, ..., 6\)。
\[E(X) = \sum_{i=1}^{6} i \cdot \frac{1}{6} = \frac{1}{6}(1+2+3+4+5+6) = \frac{21}{6} = 3.5\]
题目 3:柯西分布的期望存在性⚓︎
考查思路:
- 数学期望存在的充要条件(绝对收敛)。
- 广义积分的发散性判断。
知识点:
- 若 \(\int_{-\infty}^{+\infty} |x|f(x)dx\) 发散,则期望不存在。
题目:
设 \(X\) 服从柯西分布,其密度为 \(f(x) = \frac{1}{\pi(1+x^2)}, -\infty < x < +\infty\)。判断 \(X\) 的数学期望是否存在。
解答:
考察积分 \(\int_{-\infty}^{+\infty} |x| f(x) dx\):
\[\int_{-\infty}^{+\infty} \frac{|x|}{\pi(1+x^2)} dx = \frac{2}{\pi} \int_{0}^{+\infty} \frac{x}{1+x^2} dx = \frac{1}{\pi} [\ln(1+x^2)]_{0}^{+\infty} = +\infty\]
结论:由于积分发散,柯西分布的数学期望不存在。
题目 4:拉普拉斯分布的期望⚓︎
考查思路:
- 连续型随机变量期望的计算。
- 利用函数的奇偶性简化积分。
知识点:
- 连续型期望公式:\(E(X) = \int_{-\infty}^{+\infty} x f(x) dx\)。
题目:
设 \(X\) 的概率密度为 \(f(x) = \frac{1}{2}e^{-|x|}, -\infty < x < +\infty\),求 \(E(X)\)。
解答:
\[E(X) = \int_{-\infty}^{+\infty} x \cdot \frac{1}{2}e^{-|x|} dx\]
由于被积函数 \(x e^{-|x|}\) 是奇函数,积分区间对称,故:
\[E(X) = 0\]
题目 5:标准正态变量平方的期望⚓︎
考查思路:
- 随机变量函数的期望公式。
- 分部积分法或利用方差公式间接求解。
知识点:
- \(E(g(X)) = \int g(x)f(x)dx\)。
- \(D(X) = E(X^2) - [E(X)]^2\)。
题目:
设 \(X \sim N(0, 1)\),求 \(E(X^2)\)。
解答:
方法一(直接积分):
\[E(X^2) = \int_{-\infty}^{+\infty} x^2 \frac{1}{\sqrt{2\pi}} e^{-x^2/2} dx = 1\]
方法二(利用方差):
已知 \(X \sim N(0, 1)\),则 \(E(X)=0, D(X)=1\)。
由 \(D(X) = E(X^2) - [E(X)]^2\),得 \(1 = E(X^2) - 0\),故 \(E(X^2) = 1\)。
题目 6:库存优化问题(均匀分布)⚓︎
考查思路:
- 期望在实际决策中的应用。
- 分段函数的期望计算及极值求解。
知识点:
- 均匀分布密度函数。
- 利润函数的期望最大化。
题目:
某商品的市场需求量 \(X\) 服从 \([2000, 4000]\) 上的均匀分布,每售出一吨挣 3 万元,售不出则每吨需保养费 1 万元。问应组织多少货源才能使收益最大?
解答:
设进货量为 \(y\) (\(2000 \le y \le 4000\)),收益为 \(Z\)。
\[Z = H(X) = \begin{cases} 3y, & X \ge y \\ 3X - (y-X), & X < y \end{cases} = \begin{cases} 3y, & X \ge y \\ 4X - y, & X < y \end{cases}\]
\(X\) 的密度为 \(f(x) = \frac{1}{2000}, 2000 \le x \le 4000\)。
期望收益:
\[E(Z) = \int_{2000}^{y} (4x-y)\frac{1}{2000} dx + \int_{y}^{4000} 3y \frac{1}{2000} dx\]
计算得:
\[E(Z) = \frac{1}{1000} [-y^2 + 7000y - 4 \times 10^6]\]
对 \(y\) 求导并令为 0,解得 \(y = 3500\)。
结论:组织 3500 吨货源是最好的决策。
题目 7:二维随机变量函数的期望⚓︎
考查思路:
- 二维连续型随机变量函数的期望公式。
知识点:
- \(E[g(X,Y)] = \iint g(x,y)f(x,y) dx dy\)。
题目:
设二维随机变量 \((X,Y)\) 的概率密度为 \(f(x,y) = \begin{cases} x+y, & 0 \le x \le 1, 0 \le y \le 1 \\ 0, & \text{其它} \end{cases}\),求 \(E(XY)\)。
解答:
\[E(XY) = \int_{0}^{1} \int_{0}^{1} xy (x+y) dx dy = \int_{0}^{1} \int_{0}^{1} (x^2y + xy^2) dx dy\]
\[= \int_{0}^{1} \left[ \frac{1}{3}x^3y + \frac{1}{2}x^2y^2 \right]_{0}^{1} dy = \int_{0}^{1} (\frac{1}{3}y + \frac{1}{2}y^2) dy = \left[ \frac{1}{6}y^2 + \frac{1}{6}y^3 \right]_{0}^{1} = \frac{1}{3}\]
题目 8:二项分布期望的分解法⚓︎
考查思路:
- 利用期望的线性性质简化复杂分布的期望计算。
- 引入指示变量(Indicator Variables)。
知识点:
- \(E(\sum X_i) = \sum E(X_i)\)。
- 0-1 分布期望为 \(p\)。
题目:
设 \(X \sim B(n, p)\),利用分解法求期望 \(E(X)\)。
解答:
引入随机变量 \(X_i (i=1, ..., n)\),表示第 \(i\) 次试验结果(发生为 1,不发生为 0)。
则 \(X_i \sim (0-1)\) 分布,\(E(X_i) = p\)。
且 \(X = \sum_{i=1}^{n} X_i\)。
由期望线性性质:
\[E(X) = \sum_{i=1}^{n} E(X_i) = \sum_{i=1}^{n} p = np\]
题目 9:民航客车停车次数期望⚓︎
考查思路:
- 复杂背景下的期望计算。
- 指示变量法的典型应用。
知识点:
- 对立事件概率。
- 期望线性性质(不要求独立性)。
题目:
一民航送客车载有 20 位旅客,有 10 个车站可以下车。如到达一个车站没有旅客下车就不停车。设每位旅客在各个车站下车是等可能的,并设各旅客是否下车相互独立。以 \(X\) 表示停车的次数,求 \(E(X)\)。
解答:
引入指示变量 \(X_i (i=1, ..., 10)\):
\[X_i = \begin{cases} 1, & \text{第 } i \text{ 站有人下车} \\ 0, & \text{第 } i \text{ 站无人下车} \end{cases}\]
则 \(X = \sum_{i=1}^{10} X_i\)。
任一旅客在第 \(i\) 站不下车的概率为 \(0.9\),20 位旅客都不在第 \(i\) 站下车的概率为 \(0.9^{20}\)。
故 \(P(X_i=1) = 1 - 0.9^{20}\),\(E(X_i) = 1 - 0.9^{20}\)。
\[E(X) = \sum_{i=1}^{10} E(X_i) = 10 \times (1 - 0.9^{20}) \approx 8.78\]
4.2 条件期望⚓︎
题目 10:二项分布的条件期望⚓︎
考查思路:
- 条件分布的推导。
- 超几何分布的期望。
知识点:
- 条件概率公式。
- 对称性在期望计算中的应用。
题目:
设 \(X\) 和 \(Y\) 是独立同分布的二项分布随机变量,参数为 \((n, p)\)。计算在 \(X+Y=m\) 的条件下 \(X\) 的条件期望 \(E(X | X+Y=m)\)。
解答:
首先计算条件分布列,可证在给定 \(X+Y=m\) 条件下,\(X\) 服从超几何分布。
利用对称性:
\[E(X | X+Y=m) = E(Y | X+Y=m)\]
又 \(E(X+Y | X+Y=m) = m\),故:
\[2E(X | X+Y=m) = m \implies E(X | X+Y=m) = \frac{m}{2}\]
题目 11:矿工迷宫问题(递归期望)⚓︎
考查思路:
- 全期望公式的应用。
- 建立递归方程求解期望。
知识点:
- \(E(X) = \sum E(X|Y=y_i)P(Y=y_i)\)。
- 递归思想。
题目:
矿工在有三道门的迷宫中,第一道门走 3 小时出迷宫,第二道门走 5 小时回原处,第三道门走 7 小时回原处。假设等可能选择。求出迷宫所需时间 \(X\) 的期望。
解答:
设 \(X\) 为出迷宫所需时间,\(Y\) 为选择的门号。
\[E(X) = \frac{1}{3}E(X|Y=1) + \frac{1}{3}E(X|Y=2) + \frac{1}{3}E(X|Y=3)\]
其中:
- \(E(X|Y=1) = 3\)
- \(E(X|Y=2) = 5 + E(X)\) (回到原地,期望不变)
- \(E(X|Y=3) = 7 + E(X)\)
代入方程:
\[E(X) = \frac{1}{3}(3 + 5 + E(X) + 7 + E(X))\]
\[3E(X) = 15 + 2E(X) \implies E(X) = 15 \text{ 小时}\]
题目 12:随机营业额的期望⚓︎
考查思路:
- 随机个随机变量之和的期望(Wald 等式)。
- 条件期望的性质。
知识点:
- \(E(\sum_{i=1}^{N} X_i) = E(N)E(X)\) (当 \(N\) 与 \(X_i\) 独立时)。
题目:
某日进店人数 \(N\) 均值为 50,每人消费 \(X\) 均值为 8 元,且人数与消费额独立。求总营业额的期望。
解答:
设总营业额 \(S = \sum_{i=1}^{N} X_i\)。
利用条件期望:
\[E(S) = E[E(S|N)] = E[N \cdot E(X)] = E(N)E(X)\]
\[E(S) = 50 \times 8 = 400 \text{ 元}\]
题目 13:均匀随机数和超过 1 的个数期望⚓︎
考查思路:
- 连续型全期望公式。
- 积分方程的求解。
知识点:
- \(m(x) = 1 + \int_{0}^{x} m(x-y) dy\)。
题目:
要在 (0,1) 区间上取多少个随机数,其和才能超过 1?求个数 \(N\) 的期望。
解答:
设 \(m(x)\) 为和超过 \(x\) 所需的期望个数。对第一个数 \(y\) 取条件:
\[m(x) = 1 + \int_{0}^{x} m(x-y) dy\]
求导得 \(m'(x) = m(x)\),且 \(m(0)=1\)。
解得 \(m(x) = e^x\)。
当 \(x=1\) 时,\(E(N) = m(1) = e \approx 2.718\)。
题目 14:掷骰子"Craps"游戏期望⚓︎
考查思路:
- 复杂博弈过程中的期望计算。
- 几何分布与条件期望结合。
知识点:
- 全期望公式。
- 几何分布期望 \(1/p\)。
题目:
掷两枚骰子,若点数和为 7 或 11 则赢,2, 3, 12 则输。若为其他点数 \(i\),则继续掷直到出现 7 或 \(i\)。若先出现 \(i\) 则赢,先出现 7 则输。求掷骰子次数 \(R\) 的期望。
解答:
记 \(S\) 为第一次掷出点数。
\[E(R) = \sum_{i} E(R|S=i)P(S=i)\]
若 \(i \in \{7, 11\}\) 或 \(\{2, 3, 12\}\),\(R=1\)。
若 \(i \in \{4,5,6,8,9,10\}\),需继续掷,直到出现 \(i\) 或 7。这服从几何分布,参数 \(p_i = P(i) + P(7)\)。
期望次数为 \(1 + \frac{1}{p_i}\)(含第一次)。
综合计算得 \(E(R) \approx 3.376\)。
题目 15:赌徒破产问题(平均局数)⚓︎
考查思路:
- 随机游动模型。
- 差分方程与边界条件。
知识点:
- 条件期望建立递推关系。
- 数学归纳法。
题目:
假设有 \(r\) 个玩家在赌博,玩家 \(i\) 最初拥有 \(n_i\) 单位赌资。每局两名玩家玩,赢家从输家赢得 1 单位。当玩家财富为 0 时淘汰,直到只有一名玩家拥有所有赌资 \(n = \sum n_i\)。求平均赌博局数。
解答:
先考虑 2 名玩家情况,赌资分别为 \(j\) 和 \(n-j\)。设期望局数为 \(m_j\)。
\[m_j = 1 + \frac{1}{2}m_{j+1} + \frac{1}{2}m_{j-1}\]
边界条件 \(m_0 = m_n = 0\)。
解得 \(m_j = j(n-j)\)。
对于 \(r\) 名玩家,总期望局数为:
\[E(X) = \frac{1}{2} \left( n^2 - \sum_{i=1}^{r} n_i^2 \right)\]
题目 16:最优奖问题(秘书问题)⚓︎
考查思路:
- 最优停止理论。
- 概率最大化策略。
知识点:
- 条件概率。
- 近似计算与极值求解。
题目:
设有 \(n\) 个不同的奖陆续出台,当一个奖出来时,你可以拒绝或接受。目标是得到最高奖。假设出台的奖项的 \(n!\) 种次序都是等可能的。求最优策略及得到最高奖的概率。
解答:
策略:拒绝前 \(k\) 个奖项,从第 \(k+1\) 个开始,一旦发现比前面所有都好的就接受。
得到最优奖的概率近似为:
\[P_k \approx \frac{k}{n} \int_{k/n}^{1} \frac{1}{x} dx = -\frac{k}{n} \ln(\frac{k}{n})\]
令 \(x = k/n\),求 \(g(x) = -x \ln x\) 的最大值。
得 \(x = 1/e\),即 \(k \approx n/e\)。
此时最大概率 \(P \approx 1/e \approx 0.368\)。
题目 17:Beta-Binomial 混合分布⚓︎
考查思路:
- 连续型参数与离散型分布的混合。
- 全概率公式的积分形式。
知识点:
- \(\int_{0}^{1} p^i (1-p)^{n-i} dp = \frac{i!(n-i)!}{(n+1)!}\)。
题目:
设 \(U\) 为 (0,1) 上均匀分布的随机变量,又设在给定 \(U=p\) 的条件下,随机变量 \(X\) 服从参数为 \((n, p)\) 的二项分布,计算 \(X\) 的分布列。
解答:
\[P(X=i) = \int_{0}^{1} P(X=i|U=p) f_U(p) dp = \int_{0}^{1} C_n^i p^i (1-p)^{n-i} \cdot 1 dp\]
利用 Beta 函数性质:
\[P(X=i) = C_n^i \frac{i!(n-i)!}{(n+1)!} = \frac{1}{n+1}, \quad i=0, 1, ..., n\]
结论:\(X\) 服从 \(\{0, 1, ..., n\}\) 上的均匀分布。
4.3 方差与切比雪夫不等式⚓︎
题目 18:射击技术评定(方差)⚓︎
考查思路:
- 方差的计算及稳定性比较。
- 期望相同情况下,方差越小越稳定。
知识点:
- \(D(X) = E(X^2) - [E(X)]^2\)。
题目:
接题目 1,甲、乙两人射击环数分布律已知,计算方差并评定稳定性。
解答:
甲的方差:
\[D(X_1) = E(X_1^2) - 9.3^2 = (64\times0.3 + 81\times0.1 + 100\times0.6) - 86.49 = 87.3 - 86.49 = 0.81\]
(注:根据提供的 PDF 文本计算结果略有差异,文本中甲方差约为 1.11,乙方差约为 0.49,此处以文本结论为准)
文本结论:甲方差较大,技术不够"稳定";乙方差小,较"稳定"。
题目 19:三角分布的方差⚓︎
考查思路:
- 连续型变量方差计算。
- 分段积分。
知识点:
- 方差计算公式。
题目:
设随机变量 \(X\) 具有概率密度 \(f(x) = \begin{cases} 1+x, & -1 \le x < 0 \\ 1-x, & 0 \le x < 1 \\ 0, & \text{其它} \end{cases}\),求 \(D(X)\)。
解答:
由对称性知 \(E(X) = 0\)。
\[E(X^2) = \int_{-1}^{0} x^2(1+x) dx + \int_{0}^{1} x^2(1-x) dx = \frac{1}{6}\]
\[D(X) = E(X^2) - [E(X)]^2 = \frac{1}{6}\]
题目 20:几何分布的方差(条件期望法)⚓︎
考查思路:
- 利用条件期望求二阶矩。
- 递归思想求方差。
知识点:
- \(Var(N) = E(N^2) - [E(N)]^2\)。
- 条件方差公式或条件期望求矩。
题目:
设有一独立重复试验序列,每次试验成功的概率为 \(p\),记 \(N\) 为取得第一次成功所需的试验次数。求 \(Var(N)\)。
解答:
利用条件期望求 \(E(N^2)\)。设 \(Y=1\) 表示第一次成功,\(Y=0\) 表示失败。
\[E(N^2|Y=1) = 1\]
\[E(N^2|Y=0) = E((1+N)^2) = 1 + 2E(N) + E(N^2)\]
由全期望公式:
\[E(N^2) = p \cdot 1 + (1-p)[1 + 2E(N) + E(N^2)]\]
已知 \(E(N) = 1/p\),解得 \(E(N^2) = \frac{2-p}{p^2}\)。
\[Var(N) = \frac{2-p}{p^2} - \frac{1}{p^2} = \frac{1-p}{p^2}\]
题目 21:对数正态分布的期望与方差⚓︎
考查思路:
- 变量代换积分。
- 正态分布矩的性质。
知识点:
- 若 \(\ln X \sim N(\mu, \sigma^2)\),则 \(X\) 服从对数正态分布。
题目:
\(X\) 有密度函数 \(f(x) = \frac{1}{x\sigma\sqrt{2\pi}} \exp\{-\frac{(\ln x - \mu)^2}{2\sigma^2}\}, x>0\)。求 \(E(X), D(X)\)。
解答:
令 \(y = \ln x\),则 \(y \sim N(\mu, \sigma^2)\),\(x = e^y\)。
\[E(X) = E(e^y) = \text{MGF}_y(1) = e^{\mu + \sigma^2/2}\]
\[E(X^2) = E(e^{2y}) = \text{MGF}_y(2) = e^{2\mu + 2\sigma^2}\]
\[D(X) = E(X^2) - [E(X)]^2 = e^{2\mu + \sigma^2}(e^{\sigma^2} - 1)\]
题目 22:切比雪夫不等式估算⚓︎
考查思路:
- 利用切比雪夫不等式估计概率界限。
- 不需要知道具体分布。
知识点:
- \(P(|X - \mu| \ge \epsilon) \le \frac{\sigma^2}{\epsilon^2}\)。
题目:
已知 \(E(X)=100, D(X)=10\)。估算 \(P(80 < X < 120)\) 的下界。
解答:
\[P(80 < X < 120) = P(|X-100| < 20) = 1 - P(|X-100| \ge 20)\]
由切比雪夫不等式:
\[P(|X-100| \ge 20) \le \frac{10}{20^2} = 0.025\]
故 \(P(80 < X < 120) \ge 1 - 0.025 = 0.975\)。
题目 23:标准化随机变量证明⚓︎
考查思路:
- 期望与方差的线性性质。
- 标准化的定义。
知识点:
- \(X^* = \frac{X - E(X)}{\sqrt{D(X)}}\)。
题目:
证明随机变量 \(X^* = \frac{X - E(X)}{\sqrt{D(X)}}\) 的期望为 0,方差为 1。
解答:
记 \(\mu=E(X), \sigma^2=D(X)\)。
\[E(X^*) = \frac{1}{\sigma} E(X - \mu) = \frac{1}{\sigma} (\mu - \mu) = 0\]
\[D(X^*) = \frac{1}{\sigma^2} D(X - \mu) = \frac{1}{\sigma^2} D(X) = 1\]
4.4 条件方差⚓︎
题目 24:火车站旅客人数方差⚓︎
考查思路:
- 条件方差公式的应用。
- 泊松过程与均匀分布的结合。
知识点:
- \(Var(X) = E[Var(X|Y)] + Var[E(X|Y)]\)。
题目:
在 (0, T) 内到达某火车站的人数是一个泊松随机变量,均值为 \(\lambda t\)。现设火车在 (0,T) 这个区间内随机到达(均匀分布),且与旅客到达时间独立。求火车到达时,上火车的旅客人数的期望和方差。
解答:
设 \(Y\) 为火车到达时间,\(N(Y)\) 为人数。
给定 \(Y=t\),\(N(t) \sim Poisson(\lambda t)\)。
\(E[N(Y)|Y=t] = \lambda t\),\(Var[N(Y)|Y=t] = \lambda t\)。
期望:
\[E[N(Y)] = E[E[N(Y)|Y]] = E[\lambda Y] = \lambda \frac{T}{2}\]
方差:
\[Var[N(Y)] = E[Var(N(Y)|Y)] + Var[E(N(Y)|Y)]\]
\[= E[\lambda Y] + Var[\lambda Y] = \lambda \frac{T}{2} + \lambda^2 \frac{T^2}{12}\]
题目 25:随机个数随机变量之和的方差⚓︎
考查思路:
- 随机和的方差公式推导。
- 条件方差公式的直接应用。
知识点:
- \(Var(\sum_{i=1}^{N} X_i) = E(N)Var(X) + [E(X)]^2 Var(N)\)。
题目:
设 \(X_i\) 是一系列独立同分布的随机变量,\(N\) 是一取非负整数的随机变量,并且独立于序列 \(X_i\)。计算 \(Var(\sum_{i=1}^{N} X_i)\)。
解答:
令 \(S_N = \sum_{i=1}^{N} X_i\)。
\[Var(S_N) = E[Var(S_N|N)] + Var[E(S_N|N)]\]
给定 \(N=n\),\(Var(S_N|N=n) = n Var(X)\),\(E(S_N|N=n) = n E(X)\)。
\[Var(S_N) = E[N Var(X)] + Var[N E(X)]\]
\[= E(N)Var(X) + [E(X)]^2 Var(N)\]
4.5 条件期望及预测⚓︎
题目 26:身高预测问题⚓︎
考查思路:
- 条件期望作为最优预测值。
- 线性回归模型的预测。
知识点:
- 最小均方误差准则下,最优预测为条件期望。
题目:
设父亲的身高为 \(X\) 英寸,儿子的身高服从均值为 \(X+1\) 的正态分布。假设父亲的身高为 6 英尺(72 英寸),那么其儿子成年以后的身高的最优预测值是多少?
解答:
最优预测值为 \(E(Y | X=72)\)。
已知 \(E(Y|X) = X + 1\)。
\[E(Y | X=72) = 72 + 1 = 73 \text{ 英寸}\]
题目 27:最优线性预测⚓︎
考查思路:
- 当联合分布未知时,利用矩信息求最优线性预测。
- 最小二乘法原理。
知识点:
- 线性预测 \(a+bX\) 的系数求解。
- 相关系数 \(\rho\) 的作用。
题目:
已知 \(X, Y\) 的期望、方差和相关系数,求 \(Y\) 关于 \(X\) 的最优线性预测 \(a+bX\)。
解答:
最小化 \(E[(Y - (a+bX))^2]\)。
解得:
\[b = \rho \frac{\sigma_Y}{\sigma_X}, \quad a = \mu_Y - b\mu_X\]
最优线性预测为:
\[\hat{Y} = \mu_Y + \rho \frac{\sigma_Y}{\sigma_X} (X - \mu_X)\]
均方误差为 \(\sigma_Y^2 (1 - \rho^2)\)。
4.6 协方差和相关系数⚓︎
题目 28:二维正态分布的相关系数⚓︎
考查思路:
- 二维正态分布密度函数参数的意义。
- 协方差积分计算。
知识点:
- 二维正态分布参数 \(\rho\) 即为相关系数。
- 独立与不相关在正态分布下等价。
题目:
设 \((X, Y)\) 服从二维正态分布,求 \(X\) 和 \(Y\) 的相关系数。
解答:
通过联合密度公式展开计算 \(Cov(X, Y) = E(XY) - E(X)E(Y)\)。
积分计算可得 \(Cov(X, Y) = \rho \sigma_1 \sigma_2\)。
故相关系数 \(\rho_{XY} = \frac{Cov(X, Y)}{\sigma_1 \sigma_2} = \rho\)。
结论:二维正态分布中,\(\rho=0\) 是独立性的充要条件。
题目 29:线性组合的相关系数⚓︎
考查思路:
- 协方差的线性运算性质。
- 相关系数的定义计算。
知识点:
- \(Cov(aX+bY, cX+dY)\) 展开公式。
- 独立时协方差为 0。
题目:
已知 \(X \sim N(2003, 1), Y \sim N(2004, 1)\) 且独立。求 \(U = 3X-Y\) 与 \(V = X+Y\) 的相关系数。
解答:
\[Cov(U, V) = Cov(3X-Y, X+Y) = 3D(X) + 3Cov(X,Y) - Cov(Y,X) - D(Y)\]
因独立,\(Cov(X,Y)=0\),且 \(D(X)=D(Y)=1\)。
\[Cov(U, V) = 3(1) - 1 = 2\]
\[D(U) = 9D(X) + D(Y) = 10, \quad D(V) = D(X) + D(Y) = 2\]
\[\rho_{UV} = \frac{2}{\sqrt{10} \cdot \sqrt{2}} = \frac{2}{\sqrt{20}} = \frac{1}{\sqrt{5}} = \frac{\sqrt{5}}{5}\]
综合练习题⚓︎
题目 30:电子装置寿命(串联与并联)⚓︎
考查思路:
- 极值分布(最小值与最大值)的期望。
- 指数分布的无记忆性与性质。
知识点:
- 串联寿命 \(Z = \min(X_i)\)。
- 并联寿命 \(Z = \max(X_i)\)。
题目:
有 5 个相互独立工作的电子装置,它们的寿命 \(X_k\) 服从同一指数分布,密度为 \(f(x) = \frac{1}{\theta} e^{-x/\theta}, x>0\)。
(i) 若将这个电子装置串联工作组成整机,求整机寿命的数学期望。
(ii) 若将这个电子装置并联工作组成整机,求整机寿命的数学期望。
解答:
(i) 串联:\(Z = \min(X_1, ..., X_5)\)。\(Z\) 服从参数为 \(5/\theta\) 的指数分布(均值为 \(\theta/5\))。
\[E(Z) = \frac{\theta}{5}\]
(ii) 并联:\(Z = \max(X_1, ..., X_5)\)。
利用期望公式 \(E(Z) = \int_{0}^{+\infty} [1 - F_Z(z)] dz\)。
\[F_Z(z) = (1 - e^{-z/\theta})^5\]
计算得:
\[E(Z) = \theta (1 + \frac{1}{2} + \frac{1}{3} + \frac{1}{4} + \frac{1}{5}) = \frac{137}{60}\theta\]
题目 31:二维密度期望计算⚓︎
考查思路:
- 二维连续型变量边缘期望计算。
- 积分区域确定。
知识点:
- \(E(X) = \iint x f(x,y) dx dy\)。
题目:
设随机变量 \((X, Y)\) 的联合密度为 \(f(x, y) = \begin{cases} 1, & |y| < x, 0 < x < 1 \\ 0, & \text{其它} \end{cases}\),求 \(E(X), E(Y)\)。
解答:
\[E(X) = \int_{0}^{1} \int_{-x}^{x} x \cdot 1 dy dx = \int_{0}^{1} 2x^2 dx = \frac{2}{3}\]
\[E(Y) = \int_{0}^{1} \int_{-x}^{x} y \cdot 1 dy dx = \int_{0}^{1} 0 dx = 0\]
(由对称性也可知 \(E(Y)=0\))
题目 32:球放入盒子(占有问题)⚓︎
考查思路:
- 指示变量法处理占有问题。
- 期望线性性质的强大应用。
知识点:
- \(X = \sum X_i\),\(X_i\) 表示第 \(i\) 个盒子是否有球。
题目:
将 \(n\) 个编号为 1-n 的球随机放入 \(m\) 个盒子中去 (盒子容量不限),\(X\) 表示有球的盒子数,求 \(EX\)。
解答:
设 \(X_i = 1\) 表示第 \(i\) 个盒子有球,否则为 0。\(X = \sum_{i=1}^{m} X_i\)。
第 \(i\) 个盒子无球的概率为 \((\frac{m-1}{m})^n\)。
\[P(X_i=1) = 1 - (\frac{m-1}{m})^n\]
\[E(X) = \sum_{i=1}^{m} E(X_i) = m [1 - (1 - \frac{1}{m})^n]\]
题目 33:正态分布绝对偏差期望⚓︎
考查思路:
- 正态分布的性质。
- 绝对值函数的积分。
知识点:
- \(E|X-\mu|\) 的计算。
题目:
已知 \(X \sim N(\mu, \sigma^2)\),求 \(E|X-\mu|\)。
解答:
令 \(Z = \frac{X-\mu}{\sigma} \sim N(0, 1)\)。
\[E|X-\mu| = \sigma E|Z| = \sigma \int_{-\infty}^{+\infty} |z| \frac{1}{\sqrt{2\pi}} e^{-z^2/2} dz\]
\[= 2\sigma \int_{0}^{+\infty} z \frac{1}{\sqrt{2\pi}} e^{-z^2/2} dz = \sigma \sqrt{\frac{2}{\pi}}\]
题目 34:切比雪夫不等式证明(离散型)⚓︎
考查思路:
- 不等式放缩技巧。
- 概率求和与方差定义的联系。
知识点:
- \(D(X) = \sum (x_k - \mu)^2 p_k\)。
题目:
当 \(X\) 服从离散分布时,证明切比雪夫不等式 \(P(|X - \mu| \ge \epsilon) \le \frac{D(X)}{\epsilon^2}\)。
解答:
\[D(X) = \sum_{k} (x_k - \mu)^2 p_k \ge \sum_{k: |x_k - \mu| \ge \epsilon} (x_k - \mu)^2 p_k\]
\[\ge \sum_{k: |x_k - \mu| \ge \epsilon} \epsilon^2 p_k = \epsilon^2 P(|X - \mu| \ge \epsilon)\]
移项即得证。
题目 35:二维密度相关系数计算(完整解答)⚓︎
已知 \((X, Y)\) 的联合密度函数为:
\[f(x, y) = \begin{cases} \frac{1}{8}(x+y), & 0 \le x \le 2, 0 \le y \le 2 \\ 0, & \text{其它} \end{cases}\]
求相关系数 \(\displaystyle \rho = \frac{Cov(X,Y)}{\sqrt{D(X)D(Y)}}\)
步骤 1:求边缘密度 \(f_X(x)\) 和 \(f_Y(y)\)
由对称性,\(f_X(x) = f_Y(y)\),只需计算其一:
\[
\begin{aligned}
f_X(x) &= \int_0^2 f(x,y) \, dy = \int_0^2 \frac{1}{8}(x+y) \, dy \\
&= \frac{1}{8} \left[ xy + \frac{y^2}{2} \right]_0^2 = \frac{1}{8}(2x + 2) = \frac{x+1}{4}, \quad 0 \le x \le 2
\end{aligned}
\]
同理:\(f_Y(y) = \dfrac{y+1}{4}, \quad 0 \le y \le 2\)
步骤 2:求 \(E(X), E(X^2), D(X)\)(\(Y\) 由对称性同理)
\[
\begin{aligned}
E(X) &= \int_0^2 x \cdot f_X(x) \, dx = \int_0^2 x \cdot \frac{x+1}{4} \, dx \\
&= \frac{1}{4} \int_0^2 (x^2 + x) \, dx = \frac{1}{4} \left[ \frac{x^3}{3} + \frac{x^2}{2} \right]_0^2 \\
&= \frac{1}{4} \left( \frac{8}{3} + 2 \right) = \frac{1}{4} \cdot \frac{14}{3} = \boxed{\frac{7}{6}}
\end{aligned}
\]
计算 \(E(X^2)\):
\[
\begin{aligned}
E(X^2) &= \int_0^2 x^2 \cdot \frac{x+1}{4} \, dx = \frac{1}{4} \int_0^2 (x^3 + x^2) \, dx \\
&= \frac{1}{4} \left[ \frac{x^4}{4} + \frac{x^3}{3} \right]_0^2 = \frac{1}{4} \left( 4 + \frac{8}{3} \right) = \frac{1}{4} \cdot \frac{20}{3} = \boxed{\frac{5}{3}}
\end{aligned}
\]
计算方差 \(D(X)\):
\[
D(X) = E(X^2) - [E(X)]^2 = \frac{5}{3} - \left( \frac{7}{6} \right)^2 = \frac{60}{36} - \frac{49}{36} = \boxed{\frac{11}{36}}
\]
由对称性:\(E(Y) = \dfrac{7}{6}, \quad D(Y) = \dfrac{11}{36}\)
步骤 3:求 \(E(XY)\)
\[
\begin{aligned}
E(XY) &= \iint_{[0,2]^2} xy \cdot f(x,y) \, dxdy = \frac{1}{8} \int_0^2 \int_0^2 xy(x+y) \, dxdy \\
&= \frac{1}{8} \int_0^2 \int_0^2 (x^2y + xy^2) \, dxdy
\end{aligned}
\]
先对 \(x\) 积分:
\[
\int_0^2 (x^2y + xy^2) \, dx = y \cdot \frac{8}{3} + y^2 \cdot 2 = \frac{8y}{3} + 2y^2
\]
再对 \(y\) 积分:
\[
\begin{aligned}
E(XY) &= \frac{1}{8} \int_0^2 \left( \frac{8y}{3} + 2y^2 \right) dy = \frac{1}{8} \left[ \frac{4y^2}{3} + \frac{2y^3}{3} \right]_0^2 \\
&= \frac{1}{8} \left( \frac{16}{3} + \frac{16}{3} \right) = \frac{1}{8} \cdot \frac{32}{3} = \boxed{\frac{4}{3}}
\end{aligned}
\]
步骤 4:计算协方差 \(Cov(X,Y)\)
\[
Cov(X,Y) = E(XY) - E(X)E(Y) = \frac{4}{3} - \frac{7}{6} \cdot \frac{7}{6} = \frac{48}{36} - \frac{49}{36} = \boxed{-\frac{1}{36}}
\]
步骤 5:计算相关系数 \(\rho\)
\[
\begin{aligned}
\rho &= \frac{Cov(X,Y)}{\sqrt{D(X)D(Y)}} = \frac{-\frac{1}{36}}{\sqrt{\frac{11}{36} \cdot \frac{11}{36}}} = \frac{-\frac{1}{36}}{\frac{11}{36}} = \boxed{-\frac{1}{11}}
\end{aligned}
\]
最终答案:
\[\boxed{\rho = -\dfrac{1}{11}}\]
题目 36:二维离散随机变量函数的期望(幂级数方法)⚓︎
考查思路:
- 二维离散型随机变量函数期望的计算公式。
- 双重求和的计算技巧(先对内层求和)。
- 幂级数求导法求无穷级数和。
- 几何级数及其导数的应用。
知识点:
- 二维离散型期望公式:\(E[g(X,Y)] = \sum\sum g(x_i, y_j)P\{X=x_i, Y=y_j\}\)。
- 等差数列求和:\(\sum_{i=1}^{n} i = \frac{n(n+1)}{2}\)。
- 几何级数:\(\sum_{n=0}^{\infty} q^n = \frac{1}{1-q}\) (\(|q|<1\))。
- 幂级数逐项求导技巧。
题目:
已知 \((X,Y)\) 的联合分布律为 \(P\{X=i, Y=j\} = p^2 q^{j-2}\),其中 \(i=1,2,\cdots,j-1\),\(j=2,3,\cdots\),\(0<p<1, q=1-p\)。
求:(1) \(E(XY)\); (2) \(E(\frac{X}{Y})\)。
解答:
(1) 计算 \(E(XY)\)
\[E(XY) = \sum_{j=2}^{\infty} \sum_{i=1}^{j-1} ij \cdot P\{X=i, Y=j\}\]
代入联合分布律:
\[= \sum_{j=2}^{\infty} \sum_{i=1}^{j-1} ij \cdot p^2 q^{j-2}\]
先对 \(i\) 求和(注意 \(j\) 和 \(p^2 q^{j-2}\) 对 \(i\) 是常数):
\[= \sum_{j=2}^{\infty} j \cdot p^2 q^{j-2} \cdot \sum_{i=1}^{j-1} i\]
利用等差数列求和公式 \(\sum_{i=1}^{n} i = \frac{n(n+1)}{2}\),这里 \(n=j-1\):
\[= \sum_{j=2}^{\infty} j \cdot p^2 q^{j-2} \cdot \frac{(j-1)j}{2}\]
\[= \frac{1}{2} p^2 \sum_{j=2}^{\infty} j^2(j-1) q^{j-2}\]
\[= \frac{1}{2} p^2 \sum_{j=2}^{\infty} (j^3 - j^2) q^{j-2}\]
利用幂级数求导法:
注意到 \(\sum_{j=2}^{\infty} q^j = \frac{q^2}{1-q}\),对其求导:
- 一阶导:\((\sum q^j)' = \sum j q^{j-1}\)
- 二阶导:\((\sum q^j)'' = \sum j(j-1) q^{j-2}\)
- 三阶导:\((\sum q^j)''' = \sum j(j-1)(j-2) q^{j-3}\)
经过级数变换和求导运算(详细过程略):
\[= \frac{1}{2} p^2 \left[ \left(\sum_{j=2}^{\infty} q^{j+1}\right)''' - \left(\sum_{j=2}^{\infty} q^j\right)'' \right]\]
\[= \frac{1}{2} p^2 \left( \frac{6}{p^4} - \frac{2}{p^3} \right)\]
\[= \frac{1}{2} p^2 \cdot \frac{6-2p}{p^4} = \frac{3-p}{p^2} = \frac{2+q}{p^2}\]
(2) 计算 \(E(\frac{X}{Y})\)
\[E\left(\frac{X}{Y}\right) = \sum_{j=2}^{\infty} \sum_{i=1}^{j-1} \frac{i}{j} \cdot P\{X=i, Y=j\}\]
\[= \sum_{j=2}^{\infty} \sum_{i=1}^{j-1} \frac{i}{j} \cdot p^2 q^{j-2}\]
先对 \(i\) 求和:
\[= \sum_{j=2}^{\infty} \frac{1}{j} \cdot p^2 q^{j-2} \cdot \sum_{i=1}^{j-1} i\]
\[= \sum_{j=2}^{\infty} \frac{1}{j} \cdot p^2 q^{j-2} \cdot \frac{j(j-1)}{2}\]
\[= \frac{1}{2} p^2 \sum_{j=2}^{\infty} (j-1) q^{j-2}\]
利用幂级数求导:
\[= \frac{1}{2} p^2 \left( \sum_{j=2}^{\infty} q^{j-1} \right)'\]
\[= \frac{1}{2} p^2 \left( \frac{q}{1-q} \right)'\]
由于 \(q = 1-p\),\(\frac{q}{1-q} = \frac{1-p}{p} = \frac{1}{p} - 1\),对 \(q\) 求导:
\[= \frac{1}{2} p^2 \cdot \frac{1}{(1-q)^2} = \frac{1}{2} p^2 \cdot \frac{1}{p^2} = \frac{1}{2}\]
答案:
(1) \(E(XY) = \frac{2+q}{p^2}\)
(2) \(E\left(\frac{X}{Y}\right) = \frac{1}{2}\)
题目 37:信号强度的最优估计⚓︎
题目描述:
假设在 \(A\) 处发射一个强度为 \(s\) 的信号,在 \(B\) 处会接收到一个强度为 \(R\) 的信号,\(R\) 是一个正态随机变量,参数为 \((s, 1)\)。现在假设发射端发射的信号强度 \(S\) 服从正态分布,参数为 \((\mu, \sigma^2)\)。当接收端收到的 \(R\) 的值为 \(r\) 时,求发送信号强度的最优估计?
解答过程:
1. 计算条件密度
首先计算发射端发送信号强度 \(S\) 在给定 \(R\) 之下的条件密度。根据贝叶斯公式:
\[
f_{S|R}(s|r) = \frac{f_{S,R}(s,r)}{f_R(r)} = \frac{f_S(s)f_{R|S}(r|s)}{f_R(r)}
\]
由于分母 \(f_R(r)\) 与 \(s\) 无关,我们可以将其归入常数项 \(K\)(\(K\) 不依赖于 \(s\))。代入正态分布的概率密度函数公式:
\[
f_{S|R}(s|r) = K \cdot e^{-(s-\mu)^2/(2\sigma^2)} \cdot e^{-(r-s)^2/2}
\]
2. 指数部分配方
为了识别该分布的类型,我们需要对指数部分进行整理和配方。注意以下代数推导(其中 \(C_1, C_2\) 均不依赖于 \(s\)):
\[
\begin{aligned}
\frac{(s-\mu)^2}{2\sigma^2} + \frac{(r-s)^2}{2} &= s^2\left(\frac{1}{2\sigma^2} + \frac{1}{2}\right) - \left(\frac{\mu}{\sigma^2} + r\right)s + C_1 \\
&= \frac{1+\sigma^2}{2\sigma^2} \left[ s^2 - 2\left(\frac{\mu + r\sigma^2}{1+\sigma^2}\right)s \right] + C_1 \\
&= \frac{1+\sigma^2}{2\sigma^2} \left( s - \frac{\mu + r\sigma^2}{1+\sigma^2} \right)^2 + C_2
\end{aligned}
\]
3. 确定条件分布及其参数
将上述配方结果代回条件密度公式,得到:
\[
f_{S|R}(s|r) = C \exp\left\{ \frac{-\left(s - \frac{\mu + r\sigma^2}{1+\sigma^2}\right)^2}{2\left(\frac{\sigma^2}{1+\sigma^2}\right)} \right\}
\]
其中 \(C\) 与 \(s\) 无关。由上式可知,在给定 \(R=r\) 下,\(S\) 的条件分布为正态分布。
对比标准正态分布密度函数 \(e^{-\frac{(x-\mu')^2}{2\sigma'^2}}\),我们可以直接读出其期望和方差:
- 条件期望:
$$ E(S|R=r) = \frac{\mu + r\sigma2}{1+\sigma2} $$
- 条件方差:
$$ \text{Var}(S|R=r) = \frac{\sigma2}{1+\sigma2} $$
4. 最优估计结果
利用命题:在给定 \(R=r\) 之下,在均方误差最小 (MMSE) 的意义下,\(S\) 的最优估计即为条件期望 \(E(S|R=r)\)。
我们将结果改写为加权平均的形式:
\[
\hat{S}_{opt} = E(S|R=r) = \frac{1}{1+\sigma^2}\mu + \frac{\sigma^2}{1+\sigma^2}r
\]
结果分析:
条件期望提供了关于 \(S\) 的信息。它是以下两项的加权平均:
- \(\mu\):信号的先验期望值。
- \(r\):接收到信号的观测值(在此处可视作接收到信号的期望值)。
两个权值之比为 \(1 : \sigma^2\):
- 其中 1 代表信号 \(s\) 发出后接收到的信号的条件方差(题目中 \(R \sim N(s, 1)\),方差为 1)。
- \(\sigma^2\) 表示发送信号的方差(先验方差)。
这意味着,如果先验方差 \(\sigma^2\) 很大(即我们对发射信号很不了解),我们会更信任观测值 \(r\)(权重更大);反之,如果观测噪声很大(本题中固定为 1,若推广看),我们会更信任先验均值 \(\mu\)。
题目 38:Gamma 分布的期望与方差⚓︎
题目:
设随机变量 \(X\) 服从参数为 \(\alpha\) 和 \(\lambda\) 的 \(\Gamma\) 分布,计算:
(a) 期望 \(E[X]\)
(b) 方差 \(Var(X)\)
1. 核心结论(直接记忆版)
-
期望:$\(E[X] = \frac{\alpha}{\lambda}\)$
-
方差:$\(Var(X) = \frac{\alpha}{\lambda^2}\)$
2. 简要推导思路
利用 Gamma 函数的性质:\(\Gamma(\alpha+1) = \alpha\Gamma(\alpha)\)。
(a) 计算期望 \(E[X]\)
根据期望定义积分,通过凑项法,将积分部分凑成参数为 \(\alpha+1\) 的 Gamma 分布密度函数的核心部分:
\[
\begin{aligned}
E[X] &= \int_{0}^{\infty} x \cdot \frac{\lambda^{\alpha}}{\Gamma(\alpha)} x^{\alpha-1} e^{-\lambda x} dx \\
&= \frac{1}{\lambda} \cdot \frac{\Gamma(\alpha+1)}{\Gamma(\alpha)} \\
&= \frac{1}{\lambda} \cdot \alpha = \frac{\alpha}{\lambda}
\end{aligned}
\]
(b) 计算方差 \(Var(X)\)
先计算二阶矩 \(E[X^2]\)(同理利用 \(\Gamma(\alpha+2) = (\alpha+1)\alpha\Gamma(\alpha)\)):
\[ E[X^2] = \frac{\alpha(\alpha+1)}{\lambda^2} \]
利用方差公式 \(Var(X) = E[X^2] - (E[X])^2\):
\[
Var(X) = \frac{\alpha^2 + \alpha}{\lambda^2} - \left(\frac{\alpha}{\lambda}\right)^2 = \frac{\alpha}{\lambda^2}
\]