离散型随机变量
离散型随机变量:若随机变量全部可能取到的值是有限个或可列无限多个,这种随机变量称为离散型随机变量。
- 离散型随机变量$X$只可能离散地、孤立地取值,一但$X$的可能取值充满一个区间,就不再是离散型。
分布律:设离散型随机变量$X$所有可能取的值为$x_1,x_2,...,x_k,...$且$X$取各个可能值的概率,即事件{$X=x_k$}的概率为:
$$P\{X=x_k\}=p_k,(k=1,2,...)$$
称上式为离散型随机变量$X$的概率分布火分布律。
分布律也可以用表格的形式来表示:
分布律的充要条件:
- $p_k>=0,k=1,2,...$
- $全部加起来等于1$
离散型随机变量的分布函数:设离散型随机变量$X$的分布律为$P\{X=x_k\}=p_k,(k=1,2,...)$,由概率的可列可加性得$X$的分布函数为
$$F(x) = P\{X \leq x\} = \sum_{x_k \leq x} P\{X = x_k\} = \sum_{x_k \leq x} p_k$$
但凡说离散型,那么就有分布律。但是有分布律,不一定是离散。
离散型随机变量分布

离散型随机变量我们将会讲很多分布方式,而这里我们要着重了解二项分布,而其他哪几种变量都算是二项分布的亲戚关系(这么理解就行)
二项分布
定义:随即碧昂量$X$表示$n$重伯努利试验中事件$A$发生的次数,记每次试验中事件$A$发生的概率为$p$,则$X$的分布律为
$$P\{X = k\} = C_n^k p^k (1-p)^{n-k},\quad (k = 0,1,\cdots,n)$$
其中$0<p<1$,则称$X$服从参数为$n,p$的二项分布,记为$X-B(n,p)$
注:只有两个结果 $A$ 和 $\overline{A}$ 的试验称为伯努利(Bernoulli)试验,在相同条件下将伯努利试验独立重复进行 $n$ 次,则称为 $n$ 重伯努利试验。$n$ 重伯努利试验中,$n$ 次试验的结果相互独立,且每次试验中事件 $A$ 发生的概率相同。
0-1分布和几何分布
0-1分布(两点分布):
设随机变量$X$只可能取0与1两个值,它的分布律为
$$P\{X = k\} = p^k (1-p)^{1-k},\ k = 0,1,\ (0 < p < 1)$$
或者

则称$X$服从参数为$p$的(0-1)分布或两点分布。其实也就是n取1时候的二项分布
几何分布
可列重伯努利试验中,记每次试验中事件A发生的概率为$p$,随机变量$X$表示事件$A$首次发生时的试验次数,其分布律为
$$P\{X = k\} = (1-p)^{k-1} p,\quad (k = 1,2,\cdots)$$
其中0<p<1,则称$X$服从几何分布,记作X~Ge(p)
注:几何分布是负二项分布的特例,有点像是一直干到某件事就停止,这种感觉
泊松分布与泊松定理
泊松分布
定义:设随机变量$X$所有可能取值为$0,1,2,3,...,$其分布律为
$$ P\{X = k\} = \frac{\lambda^k e^{-\lambda}}{k!}, \quad (k = 0,1,2,\dots) $$
其中$\lambda>0$是常数,则称$X$服从参数为$\lambda$的泊松分布,记作$X \sim P(\lambda)$或$X \sim \pi(\lambda)$>
在出泊松的题目时,题目当中一定会有泊松两个字,我们来看这道例题:

我们直接来看X,可以解出$\lambda$

接着带入X=1就能解出来了
泊松定理
泊松定理:设 $\lambda > 0$ 是一个常数,$n$ 是任意正整数,设 $\lambda = np_n$,则对于任意固定的非负整数 $k$ 有
$$ \lim_{n \to \infty} P\{X = k\} = \lim_{n \to \infty} C_n^k p_n^k (1-p_n)^{n-k} \approx \frac{(np_n)^k}{k!} e^{-np_n} \quad (k = 0,1,2,\dots) $$

我们可以得到以下这个:

当然如果我们写题目的话,必须得出题人让你用你才能用,要不然继续使用二项分布计算。
-
泊松定理直观解释:设一段时间内事件 $A$ 发生的次数 $X \sim P(\lambda)$ 表示,不妨记这段时间为 $[0,1]$ 并等分成 $n$ 段($n$ 很大),每段时长 $\frac{1}{n}$。近似认为每段时间内 $A$ 发生的概率与时长成正比,即取 $p_n = \frac{\lambda}{n}$,且因为 $\frac{1}{n}$ 足够短,$A$ 在每段时间内不可能发生两次以上。故每段时间内 $A$ 是否发生可近似视作伯努利试验,$X$ 近似服从$B\left(n, \frac{\lambda}{n}\right)$,当 $n \to \infty$ 时在数学上严格成立。
-
一般当 $n$ 很大($n \geq 20$),$p$ 很小($p \leq 0.05$)时,二项分布 $B(n,p)$ 用泊松分布作近似效果较好。
超几何分布
超几何分布 若随机变量 $X$ 的分布律为
$$ P\{X = k\} = \frac{C_M^k C_{N-M}^{n-k}}{C_N^n}, \quad k = \max\{0, n-N+M\}, \dots, \min\{n, M\} $$
其中 $M,N,n$ 都是正整数,则称 $X$ 服从参数为 $M,N,n$ 的超几何分布,记作 $X \sim H(n,M,N)$(无放回抽样)。- 超几何分布的背景——设 $N$ 件产品中有 $M$ 件次品,从中无放回取 $n$ 次,则取到次品数 $X$ 服从超几何分布 $H(n,M,N)$
- 当 $n$ 和 $\displaystyle \frac{M}{N}$ 固定,$N \to \infty$ 时,$X$ 近似服从二项分布 $X \sim B\left(n, \frac{M}{N}\right)$。其实就是数据量足够大的时候,取一个完全不影响
其实本质就是无放回抽样,也就是说一次取n件
说些什么吧!