离散型随机变量的独立性
独立性定义
对于离散型随机变量 $X, Y$,若对所有 $i, j$ 满足:
$$P\{X=x_i, Y=y_j\} = P\{X=x_i\} \cdot P\{Y=y_j\} $$
则称 $X$ 与 $Y$ 相互独立。
例题1:判断独立性
联合分布表:
| $X \setminus Y$ | $0$ | $1$ | $P\{X=x_i\}$ |
|---|---|---|---|
| $0$ | $0.3$ | $0.3$ | $0.6$ |
| $1$ | $0.3$ | $0.4$ | $0.4$ |
| $P\{Y=y_j\}$ | $0.6$ | $0.4$ | $1$ |
检验:
- $P\{X=0,Y=0\} = 0.3$
- $P\{X=0\} \cdot P\{Y=0\} = 0.6 \times 0.6 = 0.36$
- 因为 $0.3 \neq 0.36$,故 $X$ 与 $Y$ 不独立。
例题2:补全独立分布表
边缘分布:
- $P\{X=0\} = \frac{1}{2},\ P\{X=1\} = \frac{1}{2}$
- $P\{Y=0\} = \frac{1}{3},\ P\{Y=1\} = \frac{2}{3}$
根据独立性 $P\{X=x_i,Y=y_j\} = P\{X=x_i\}P\{Y=y_j\}$,补全表格:
| $X \setminus Y$ | $0$ | $1$ | 边缘和 |
|---|---|---|---|
| $0$ | $\frac{1}{6}$ | $\frac{1}{3}$ | $\frac{1}{2}$ |
| $1$ | $\frac{1}{6}$ | $\frac{1}{3}$ | $\frac{1}{2}$ |
| 边缘和 | $\frac{1}{3}$ | $\frac{2}{3}$ | $1$ |
离散型随机变量独立性与条件分布
核心公式回顾
-
独立性定义:
若 $X$ 与 $Y$ 相互独立,则对所有 $i,j$:$$P\{X=x_i, Y=y_j\} = P\{X=x_i\} \cdot P\{Y=y_j\} $$
-
条件分布公式:
$$P\{X=x_i \mid Y=y_j\} = \frac{P\{X=x_i, Y=y_j\}}{P\{Y=y_j\}} $$
若 $X,Y$ 独立,则 $P\{X=x_i \mid Y=y_j\} = P\{X=x_i\}$。
例题 3:补全独立联合分布表
已知 $X$ 与 $Y$ 独立,联合分布表如下,求 $\alpha, \beta$:
| $X \setminus Y$ | $1$ | $2$ | $3$ | $P\{X=x_i\}$ |
|---|---|---|---|---|
| $1$ | $\frac{1}{6}$ | $\frac{1}{9}$ | $\frac{1}{18}$ | $\frac{1}{3}$ |
| $2$ | $\frac{1}{3}$ | $\alpha$ | $\beta$ | $\frac{2}{3}$ |
| $P\{Y=y_j\}$ | $\frac{1}{2}$ | $\frac{1}{3}$ | $\frac{1}{6}$ | $1$ |
求解过程
- 由 $P\{X=1,Y=2\} = P\{X=1\}P\{Y=2\}$:
$$\frac{1}{3} \left( \frac{1}{9} + \alpha \right) = \frac{1}{9} \implies \alpha = \frac{2}{9} $$
- 由 $P\{X=1,Y=3\} = P\{X=1\}P\{Y=3\}$:
$$\frac{1}{3} \left( \frac{1}{18} + \beta \right) = \frac{1}{18} \implies \beta = \frac{1}{9} $$
例题 4:验证独立性与条件分布
已知边缘分布:
- $X$:$P\{X=0\}=0.4,\ P\{X=1\}=0.6$
- $Y$:$P\{Y=1\}=0.3,\ P\{Y=2\}=0.2,\ P\{Y=3\}=0.5$
联合分布表:
| $X \setminus Y$ | $1$ | $2$ | $3$ | $P\{X=x_i\}$ |
|---|---|---|---|---|
| $0$ | $0.12$ | $0.08$ | $0.2$ | $0.4$ |
| $1$ | $0.18$ | $0.12$ | $0.3$ | $0.6$ |
| $P\{Y=y_j\}$ | $0.3$ | $0.2$ | $0.5$ | $1$ |
独立性验证
- $P\{X=0,Y=1\}=0.12 = 0.4 \times 0.3 = P\{X=0\}P\{Y=1\}$
- $P\{X=1,Y=1\}=0.18 = 0.6 \times 0.3 = P\{X=1\}P\{Y=1\}$
- 其余同理,均满足独立条件,故 $X$ 与 $Y$ 独立。
条件分布验证
- $P\{X=0 \mid Y=1\} = \frac{0.12}{0.3} = 0.4 = P\{X=0\}$
- $P\{X=1 \mid Y=1\} = \frac{0.18}{0.3} = 0.6 = P\{X=1\}$
- 验证了独立时条件分布等于边缘分布的性质。
关键结论
- 联合分布可以唯一确定边缘分布,但边缘分布一般不能唯一确定联合分布,除非已知独立性。
- 若 $X$ 与 $Y$ 独立,则条件分布与边缘分布相同,即:
$$P\{X=x_i \mid Y=y_j\} = P\{X=x_i\}, \quad P\{Y=y_j \mid X=x_i\} = P\{Y=y_j\} $$
连续型随机变量独立性判定 上
核心定义
二维连续型随机变量 $X, Y$ 相互独立的充要条件:
$$f(x,y) = f_X(x) \cdot f_Y(y) $$
其中 $f(x,y)$ 为联合概率密度,$f_X(x), f_Y(y)$ 为边缘概率密度。
例题5 解析
题目
设二维随机变量 $(X,Y)$ 的联合概率密度为:
$$f(x,y) = \begin{cases} x e^{-(x+y)}, & x>0,\ y>0 \\[6pt] 0, & \text{其他} \end{cases} $$
判断 $X$ 与 $Y$ 是否相互独立。
步骤1:求 $X$ 的边缘密度 $f_X(x)$
当 $x>0$ 时:
$$f_X(x) = \int_{-\infty}^{+\infty} f(x,y) dy = \int_{0}^{+\infty} x e^{-(x+y)} dy $$
分离变量计算:
$$= x e^{-x} \int_{0}^{+\infty} e^{-y} dy = x e^{-x} \cdot 1 = x e^{-x} $$
当 $x \le 0$ 时,$f(x,y)=0$,故 $f_X(x)=0$。
因此:
$$f_X(x) = \begin{cases} x e^{-x}, & x>0 \\[6pt] 0, & x \le 0 \end{cases} $$
步骤2:求 $Y$ 的边缘密度 $f_Y(y)$
当 $y>0$ 时:
$$f_Y(y) = \int_{-\infty}^{+\infty} f(x,y) dx = \int_{0}^{+\infty} x e^{-(x+y)} dx $$
分离变量计算:
$$= e^{-y} \int_{0}^{+\infty} x e^{-x} dx = e^{-y} \cdot 1 = e^{-y} $$
当 $y \le 0$ 时,$f(x,y)=0$,故 $f_Y(y)=0$。
因此:
$$f_Y(y) = \begin{cases} e^{-y}, & y>0 \\[6pt] 0, & y \le 0 \end{cases} $$
步骤3:验证独立性
当 $x>0,\ y>0$ 时:
$$f_X(x) \cdot f_Y(y) = x e^{-x} \cdot e^{-y} = x e^{-(x+y)} = f(x,y) $$
在其他区域,两边均为0,等式仍成立。
因此,$X$ 与 $Y$ 相互独立。
例题二
题目背景
老板到达时间 $X$ 在 8-12 时均匀分布,秘书到达时间 $Y$ 在 7-9 时均匀分布,且 $X$ 与 $Y$ 相互独立。求两人到达时间差不超过 5 分钟的概率,即 $P\{|X-Y| \le \frac{1}{12}\}$(5 分钟 = $\frac{1}{12}$ 小时)。

步骤1:写出边缘密度
-
老板到达时间 $X$ 的边缘密度:
$$f_X(x) = \begin{cases} \dfrac{1}{4}, & 8 \le x \le 12 \\[6pt] 0, & \text{其他} \end{cases} $$
-
秘书到达时间 $Y$ 的边缘密度:
$$f_Y(y) = \begin{cases} \dfrac{1}{2}, & 7 \le y \le 9 \\[6pt] 0, & \text{其他} \end{cases} $$
步骤2:求联合密度(利用独立性)
因 $X$ 与 $Y$ 独立,故联合密度为:
$$f(x,y) = f_X(x) \cdot f_Y(y) = \begin{cases} \dfrac{1}{8}, & 8 \le x \le 12,\ 7 \le y \le 9 \\[6pt] 0, & \text{其他} \end{cases} $$
步骤3:转化概率条件
题目条件 $|X-Y| \le 5$ 分钟,即:
$$P\{|X-Y| \le \frac{5}{60}\} = P\{|X-Y| \le \frac{1}{12}\} $$
等价于:
$$-\frac{1}{12} \le X-Y \le \frac{1}{12} $$
即两条直线 $y = x - \frac{1}{12}$ 与 $y = x + \frac{1}{12}$ 之间的区域。
步骤4:计算积分区域面积
在 $8 \le x \le 12,\ 7 \le y \le 9$ 的矩形区域内,满足 $|x-y| \le \frac{1}{12}$ 的区域为两条直线之间的部分,计算得该区域面积:
$$S_G = \frac{1}{6} $$
步骤5:计算概率
均匀分布下概率 = 联合密度 × 区域面积:
$$P\{|X-Y| \le \frac{1}{12}\} = \frac{1}{8} \times \frac{1}{6} = \frac{1}{48} $$
markdown
连续型随机变量独立性判定 下
例题:独立标准正态变量的联合分布
设 $X \sim N(0,1)$,$Y \sim N(0,1)$,且 $X$ 与 $Y$ 相互独立,求联合概率密度 $f(x,y)$。
步骤1:写出边缘密度
- $X$ 的边缘密度:
$$f_X(x) = \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}},\quad x \in (-\infty,+\infty) $$
- $Y$ 的边缘密度:
$$f_Y(y) = \frac{1}{\sqrt{2\pi}} e^{-\frac{y^2}{2}},\quad y \in (-\infty,+\infty) $$
步骤2:利用独立性求联合密度
由 $X$ 与 $Y$ 独立,得:
$$f(x,y) = f_X(x) \cdot f_Y(y) = \frac{1}{2\pi} e^{-\frac{x^2+y^2}{2}},\quad x,y \in (-\infty,+\infty) $$
此时 $(X,Y) \sim N(0,0;1,1;0)$,即二维标准正态分布,相关系数 $\rho=0$。
推广结论
若 $X \sim N(\mu_1,\sigma_1^2)$,$Y \sim N(\mu_2,\sigma_2^2)$ 且相互独立,则:
$$(X,Y) \sim N\left(\mu_1,\mu_2;\sigma_1^2,\sigma_2^2;0\right) $$
即二维正态分布,且相关系数 $\rho=0$。
关键知识点总结
-
二维正态分布的独立性:
若 $(X,Y) \sim N(\mu_1,\mu_2;\sigma_1^2,\sigma_2^2;\rho)$,则$$X \text{ 与 } Y \text{ 相互独立} \iff \rho=0 $$
(相关系数为0,即不相关)
-
均匀分布的独立性:
- 若 $(X,Y)$ 在矩形区域 $a \le x \le b,\ c \le y \le d$ 上均匀分布,则 $X$ 与 $Y$ 相互独立。
- 若 $(X,Y)$ 在圆域 $x^2+y^2 \le R^2$ 上均匀分布,则 $X$ 与 $Y$ 不独立。
联合密度与边缘密度的关系
-
一般情况下:
联合密度 $f(x,y)$ 可以唯一确定边缘密度 $f_X(x), f_Y(y)$;
但反过来,边缘密度 不能 唯一确定联合密度。 -
当 $X$ 与 $Y$ 相互独立时:
$$f(x,y) = f_X(x) \cdot f_Y(y) $$
此时边缘密度可以唯一确定联合密度。
独立性对条件密度的影响
若 $X$ 与 $Y$ 相互独立,则:
- $X$ 在 $Y=y$ 条件下的条件密度:
$$f_{X|Y}(x|y) = \frac{f(x,y)}{f_Y(y)} = \frac{f_X(x) \cdot f_Y(y)}{f_Y(y)} = f_X(x) $$
- $Y$ 在 $X=x$ 条件下的条件密度:
$$f_{Y|X}(y|x) = f_Y(y) $$
结论:
当 $X$ 与 $Y$ 独立时,条件密度与边缘密度相同,条件分布与条件无关,即:
$$f_{X|Y}(x|y) = f_X(x),\quad f_{Y|X}(y|x) = f_Y(y) $$
独立随机变量函数的独立性性质
核心定理
若随机变量 $X$ 与 $Y$ 相互独立,且 $g_1(x), g_2(y)$ 为一元连续函数,则随机变量 $g_1(X)$ 与 $g_2(Y)$ 也相互独立。
常见例子
-
幂函数变换
若 $X$ 与 $Y$ 相互独立,则 $X^2$ 与 $Y^2$ 也相互独立。 -
线性变换
若 $X$ 与 $Y$ 相互独立,且常数 $a \neq 0, b, c \neq 0, d$,则 $aX+b$ 与 $cY+d$ 也相互独立。
直观理解
独立性的本质是“一个变量的取值不影响另一个变量的概率分布”。对两个独立变量分别做各自的连续变换,相当于对它们的取值做独立的映射,不会引入新的关联,因此变换后的变量依然保持独立。
说些什么吧!