7. 专业课复习 | 概率论与数理统计BM talk

7. 专业课复习 | 概率论与数理统计

16分钟 ·
播放数0
·
评论数0

注意:由于出现很多公式,ai在处理公式时不准确,具体公式需要自己看

第一部分:内容大纲

一、概率论

  1. 随机事件与概率基础

  2. 一维随机变量及常见分布

  3. 多维随机变量、独立性与相关性

  4. 随机变量数字特征

  5. 大数定律与中心极限定理

二、数理统计

  1. 抽样分布与三大统计分布

  2. 参数估计(点估计 + 区间估计)

  3. 假设检验原理与两类错误

  4. 一元线性回归分析


第二部分:具体内容

一、概率论

1. 随机事件与概率基础

概率论的起点是随机试验、样本空间和随机事件。我们重点理清三个易混淆的关系:

  • 互斥:A 和 B 不能同时发生,交集为空;

  • 对立:非此即彼,和为样本空间,交集为空;

  • 独立:A 发生不影响 B,满足 P (AB)=P (A) P (B)。

这里有个关键结论:互斥一般不独立,独立一般不互斥,除非其中一个事件概率为 0。

核心公式包括:

  • 条件概率:P (B|A)=P (AB)/P (A)

  • 乘法公式:P (AB)=P (A) P (B|A)=P (B) P (A|B)

  • 全概率公式:由因推果,把所有原因的概率加总得到结果总概率

  • 贝叶斯公式:由果推因,已知结果反推某个原因的概率

2. 一维随机变量及常见分布

随机变量把事件量化,用分布函数 F (x)=P (X≤x) 描述整体概率。它单调不减、右连续,两端极限分别为 0 和 1。

随机变量分两类:

  • 离散型:用分布律描述,常见 0-1 分布、二项分布、泊松分布;

  • 连续型:用概率密度 f (x) 描述,分布函数是密度的积分。

重点分布:

  • 均匀分布:区间内概率均等;

  • 指数分布:具有无记忆性,常用于寿命模型;

  • 正态分布:最常用,可标准化为标准正态 N (0,1),是查表计算的基础。

3. 多维随机变量、独立性与相关性

多维变量看联合分布,把另一个变量全部 “积掉” 就得到边缘分布。

  • 独立判定:联合分布 = 边缘分布的乘积;

  • 协方差与相关系数:衡量线性相关程度,相关系数被标准化到 [-1,1]。

高频易错点:独立一定不相关,但不相关不一定独立,只有二维正态分布两者等价。

4. 随机变量数字特征

  • 期望:加权平均值,满足线性性质,不管是否独立都可拆分;

  • 方差:衡量波动大小,公式为 D (X)=E (X²)-[E (X)]²;

  • 独立时,和的方差 = 方差之和。

常见分布期望方差速记:

  • 二项分布:E=np,D=np (1-p)

  • 泊松分布:E=λ,D=λ

  • 均匀分布:E=(a+b)/2,D=(b-a)²/12

  • 指数分布:E=1/λ,D=1/λ²

  • 正态分布:E=μ,D=σ²

5. 大数定律与中心极限定理

  • 切比雪夫不等式:给出概率的上界估计;

  • 中心极限定理:大样本下,独立同分布变量的均值近似正态分布,这就是自然界大量现象服从正态分布的原因。

二、数理统计

1. 抽样分布与三大统计分布

数理统计从样本反推总体。统计量是不含未知参数的样本函数。三大抽样分布:

  • 卡方分布:标准正态的平方和;

  • t 分布:形似正态,尾部更厚,大样本趋近正态;

  • F 分布:两个卡方分布除以自由度的比值。

2. 参数估计

参数估计分点估计区间估计

  • 矩估计:用样本矩代替总体矩列方程求解;

  • 极大似然估计:让样本出现的概率最大,步骤是写似然函数→取对数→求导→解方程。

估计量有三个评价标准:无偏性、有效性、相合性。

区间估计用枢轴量法,正态总体方差已知用 Z 统计量,方差未知用 t 统计量。

3. 假设检验

假设检验基于小概率原理:小概率事件在一次试验中几乎不发生。

步骤:提假设→构造统计量→确定拒绝域→计算并决策。

两类错误:

  • 第一类弃真:原假设为真却拒绝,概率 α;

  • 第二类取伪:原假设为假却接受,概率 β。

    固定样本量时,α 和 β 此消彼长,同时减小需要加大样本量。

4. 一元线性回归分析

模型:Y=β₀+β₁X+ε,误差服从正态分布。

最小二乘法最小化残差平方和,得到最优拟合直线。

用 t 检验判断线性关系是否显著,R² 越接近 1,拟合效果越好

三、专业英语高频考点

核心词汇:

Probability Distribution、Mean、Variance、Standard Deviation、Hypothesis Testing、Confidence Interval、Correlation and Regression。