概率论学习笔记

随机试验

简称试验,有三大性质:可重复性 可观测性 随机性

样本点:最基本的结果,通常用 $\omega$ 表示,如 CE,WA,AC...
样本空间:所有样本点组成的集合,用 $\Omega$ 表示,即 {CE,WA,AC,RE,TLE...}
随机事件:样本空间的子集,若干样本点构成的集合,用 A,B,C 表示.
基本事件:样本空间的单点集,也就是包含一个基本结果的集合 {TLE} .
必然事件:用 $\Omega$ 表示.
不可能事件:用 $\Phi$ 表示.

集合交并补运算,迪摩根律(忽略)
差:事件A发生但是B不发生,记作 A-B .

频率

n次试验中A发生na次有

频率:非负性,规范性(对于必然事件频率是1),有限可加性(对于两两不相容的事件,他们至少发生一个的概率是频率相加,有下式)

频率不是概率,有波动性,随着测试次数增加趋于稳定…

概率

非负性,规范性,可列可加性(频率的式子改改就是了)

性质:如果 $A\subseteq B$ 有 $P(B-A)=P(B)-P(A)$

减法公式:对任意事件AB有

加法公式:任意事件AB有

本质是容斥,可以推到三个事件.

古典概型(等可能概型)

有限样本空间,每个样本点等可能.

几何概型

有限样本空间,概率只和几何大小有关.

例题-蒲丰投针问题

平面上均匀画有平行直线,间距2a,你要不停扔长度2l的针($l<a$),求针和任意直线相交的概率.

设针中点和最近直线距离为l,夹角为 $\varphi$ ,有

相交的充要条件是

然后画出图形求定积分

条件概率

若 $P(A)>0$ ,称

叫做A发生下事件B发生的概率.

由于”非负性,规范性,可列可加性”,所以条件概率也是概率.

常用公式:

条件概率的本质是把事件A看成条件,也就是把A看成新的样本空间.

乘法公式:如果 $P(B)>0$ 有

如果 $P(A)>0$ 有

推广:

如果 $P(A_1A_2…a_n)>0$ 有(套娃)

全概率公式

把整个样本空间拆分成 $A_1…A_n$ n个两两不相容的事件,然后他们并一起就是样本空间,有

贝叶斯公式

由乘法公式

带入全概率公式得

$A_1…A_n$ 可以看作是导致结果B发生的各种原因.
$P(A_i|B)$ 是B发生下 $A_i$ 引起的概率,称作 后验概率 .
$P(A_i)$ 称作先验概率.

事件的独立性

如果有

则称事件 $A,B$ 相互独立.另一种定义:

必然事件和不可能事件与任何事件独立.

独立和不相容关系:

相互独立: $P(AB)=P(A)P(B)$
互不相容: $AB=\Phi$
若 $P(A)>0,P(B)>0$ ,则独立和不相容不可能同时成立.

则称 $ABC$ 相互独立.

则称事件 $A_1…A_n$ 独立.

伯努利概型

两种结果,试验独立,区别于二项分布的点是,这个分布没有乘上二项式系数(组合数),乘上组合数的伯努利分布叫做二项分布.

随机变量及其概率分布

随机变量: $X$
变量 $X$ 的分布函数: $F(x)=P{X\le x},(-\infty<X<+\infty)$

概率分布函数:分情况讨论的大括号…
性质:单调不减

离散型随机变量

列表法体现分布律.
分布函数:阶梯一样的函数,范围一般取左端点取不到右端点.

连续型随机变量及其概率密度

分布函数 $F(x)$ 满足

$f(x)$ 叫做概率密度函数,可以不连续,也可以不唯一.
$F(x)$ 在 $(-\infty,+\infty)$ 是连续的.

性质2:
性质5: ,连续随机变量取任意点 $c$ 的概率为 $0$ .
所以,概率为 $0$ 不一定是不可能事件.
同理,概率为 $1$ 也不一定是必然事件.
性质6: 连续性随机变量取值落在某一区间的概率和区间开闭无关.

几种常用的离散分布

  1. 两点分布((0-1)分布)

  2. 二项分布( $X\sim B(n,p)$ ,试验进行n次,每次概率为p)(~ in $\LaTeX:\mathrm{sim}$)

  3. 泊松分布

    随机变量取值为 $0,1,…$ ,且有

    记作 $X\sim P(\lambda)$ 或 $X\sim\pi(\lambda)$

    泊松定理:设 $np_n=\lambda$ 对任意非负整数 $k$ 有

    也就是说,泊松分布是二项分布的极限分布,当n很大p很小时,二项分布就可以近似地看成是参数 $\lambda=np$ 的泊松分布.
    在实际计算中,当 $n\ge20,p\le0.05$ 时近似效果较好.

    小概率事件 :可以借助小概率事件判定事情的真实性.因为小概率事件发生了可以让人们怀疑其正确性.

  4. 几何分布:试验只有俩结果,要进行试验直到事件发生,称为几何分布,测试次数是随机变量.

几种常用的连续随机变量和分布

  1. 均匀分布
  2. 指数分布
  3. 正态分布 $X\sim N(\mu,\sigma^2)$

    其分布函数为

    性质: $\mu$ 是位置参数(变大图像右移), $\sigma$ 是形状参数(变大图像变平坦)

  4. 标准正态分布( $\mu=0,\sigma=1$ )性质:若 $X\sim N(\mu,\sigma^2)$ ,则 $Y=\frac{X-\mu}{\sigma}\sim N(0,1)$ .
    然后是统计规律:

随机变量的函数的分布

离散型

  1. 先求随机变量X的分布律
  2. 然后对Y求分布律,把概率相同项叠加.

连续型

  1. 先求随机变量 $Y=g(X)$ 的分布函数然后求导,有

h(x)是反函数,若存在(g(x)严格单调处处可导)则有


  1. ABC两两独立和ABC相互独立的区别

    两两独立: $P(AB)=P(A)P(B)$ ,…(任意两个都满足这样的式子)
    相互独立(额外条件): $P(ABC)=P(A)P(B)P( C )$

  2. $P(A\overline B)=P(A)-P(AB)$ 理解:A发生B不发生

  3. 相容和独立的区别

    不相容(互斥): $P(AB)=0$
    独立: $P(AB)=P(A)P(B)$

  4. $P(A|B)=\frac{P(AB)}{P(B)}$

  5. $P(\overline A~\overline B)=P(\overline{A+B})=1-P(A+B)$

  6. $P(A|B)+P(\overline A|B)=1$ 隐藏条件

  7. 指数分布

    泊松分布

  8. 正态分布标准化:

  9. $f(x),F(x)$ ,对 $-X$ 有

    对 $F(x)$ 求导得

  10. 例题:求概率密度

    这么写过程:当 $y<0$ 时, $F_Y(y)=P{Y\le y}=P{X^2\le y}=0$

    然后概率密度通过求导.

  11. 独立的两个随机变量 $XY$ 满足 $f(x,y)=fX(x)f_Y(y)$ .
    且 $f
    {XY}(x,y)=\frac{\partial^2F(x,y)}{\partial x\partial y}$ .

  12. 多个正态分布叠加: $Z=aX+BY+c$ 有

  13. 二维正态分布: $N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)$

    当 $\rho$ 为 $0$ 时,两个变量相互独立,也就能直接拆成 $X\sim N(\mu1,\sigma_2^2)$ 和 $Y\sim N(\mu,\sigma_2^2)$ ,其余时候等高线是椭圆,不过也是可以直接拆,但是在算方差记得加上cov.

  14. 二维条件概率:

  15. 两个变量独立,然后 $Z=X+Y$ 怎么算?

  16. 高斯积分

  17. 最大值,最小值公式:
    因为max是两个都要小于z,故直接对z积分即可.

    最小值是反过来减去最大值:

  18. 数学期望(假设此积分绝对收敛,数学期望可以不存在)

    方差

    协方差(独立的随机变量协方差为0)

    相关系数(相互独立为0, $\rho\in[-1,1]$ )

  19. 期望性质

    若变量独立,有

    注意 :上述性质只能推出来XY不相关,也就是说cov=0,方差可以直接相加 $D(X+Y)=D(X)+D(Y)$

  20. 期望实战

  21. 方差性质

    若XY相互独立,则

    若X是常数,方差为0,反过来不成立.

  22. 协方差性质

  23. 几种分布的期望和方差等

E D sgn f F
(0-1)分布 $p$ $p(1-p)$
指数分布 $\frac1\lambda$ $\frac1{\lambda^2}$ $X\sim E(\lambda)$
二项分布 $np$ $np(1-p)$ $X\sim B(n,p)$
几何分布 $\frac1p$ $\frac{1-p}{p^2}$
泊松分布 $\lambda$ $\lambda$ $X\sim\pi(\lambda),X\sim P(\lambda)$
均匀分布 $\frac{a+b}2$ $\frac{(a-b)^2}{12}$ $X\sim U(a,b)$
正态分布 $\mu$ $\sigma^2$ $X\sim N(\mu,\sigma^2)$
  1. 标准正态分布标志是 $\varphi=\frac1{\sqrt{2\pi}}e^{-\frac{x^2}2}$ ,其分布函数为 $\Phi$ ,注意 $\Phi$ 是积不出来的.

  2. 由 $Z=g(x,y)$ 可以解出 $y=h(x,z)$ ,代入有

    min与max的分布:

  3. 确定常数c满足xx是参数为xx的无偏估计量.
    得到式子 $CE(xxx)=xx$ 然后求出常数.

切比雪夫不等式

设期望是 $E(X)=\mu$ ,方差 $D(X)=\sigma^2$ ,然后

大数定律

中心极限定理

独立同分布

设单个X期望是 $\mu$ ,方差是 $\sigma^2$ ,则

平均值

假设 $X\sim N(\mu,\sigma)$ ,则 $\overline X\sim N(\mu,\frac\sigma n)$ .

更广泛的情况

其实就是期望和方差用统计值换了一下…

统计量和分布

不含任何未知参数的是统计量,如 是, 不是.

样本方差公式

反正由于某种原因,样本方差是 $\frac1{n-1}$ 而不是 $\frac1n$ 这一点一定要牢记!!!
还有的性质是 $E(S^2)=\sigma^2$

三大分布

$\chi^2$ 分布

若干样本 $X_i\sim N(0,1)$ ,记 $X_1^2+…+X_n^2\sim\chi^2(n)$ 服从卡方分布.(必须是标准正态分布,n被称为自由度).
卡方分布有 $E(\chi^2)=n,D(\chi^2)=2n$

推论1:设 $X_i\sim N(\mu,\sigma^2)$ ,有服从卡方分布

推论2:

两个独立的卡方分布加一起: $\chi^2(a+b)$

t分布

设 $X\sim N(0,1),Y\sim\chi^2(n)$ ,且XY独立,则随机变量服从t分布,有下面式子

记作 $t\sim t(n)$

推论: $t=\frac{\overline X-\mu}{S}\sqrt n\sim t(n-1)$

F分布

设 $X\sim \chi^2(m),Y\sim\chi^2(n)$ ,且XY独立,则随机变量服从F分布,有下面式子

记作 $F\sim F(m,n)$ ,第一自由度m,第二自由度n.

正态总体的抽样分布

总体方差 $\sigma$ ,均值 $\mu$ ,样本方差 $s^2$ ,均值 $\overline X$ .

假设总体符合正态分布,随机抽几个样本符合正态分布: $\overline X\sim N(\mu,\frac{\sigma^2}n)$

矩估计

  1. 求期望
  2. 将期望E=xxx换成 $(E=)\overline X=xxx$
  3. 将未知数用 $\overline X$ 表示(求反函数)

最大似然估计

  1. 先把函数抄一遍
  2. 构造似然函数 $L(x_1,x_2,…,x_n,\theta)=f(x_1)f(x_2)…f(x_n)$
    (直接乘起来算答案)
  3. 对似然函数取对数,得到 $\ln L(x_1,x_2,…,x_n,\theta)$
  4. 上述对数函数对 $\theta$ 求偏导 $\frac{\partial \ln L}{\partial \theta}$
  5. 令上述偏导为0,得到 $\hat\theta$ 的值.
  6. (不用真的带入计算)证明 $\hat\theta$ 是一个极大值,用到高中证明单调性的方法,函数在xxx怎么怎么样.

无偏性 有效性 一致性

无偏估计: $E(\hat\theta)=\theta$ 人话:系数加一起等于1,如 $X=0.5X_1+0.5X_2$ 是, $0.6X_2$ 就不是了.
有效性:比方差看哪个小哪个更有效,如 $x2$ 不如 $\frac12x1+\frac16x2+\frac13x3$ .