7. 专业课复习 | 概率论与数理统计 - BM talk | 小宇宙

注意：由于出现很多公式，ai在处理公式时不准确，具体公式需要自己看

第一部分：内容大纲

一、概率论

随机事件与概率基础
一维随机变量及常见分布
多维随机变量、独立性与相关性
随机变量数字特征
大数定律与中心极限定理

二、数理统计

抽样分布与三大统计分布
参数估计（点估计 + 区间估计）
假设检验原理与两类错误
一元线性回归分析

第二部分：具体内容

一、概率论

1. 随机事件与概率基础

概率论的起点是随机试验、样本空间和随机事件。我们重点理清三个易混淆的关系：

互斥：A 和 B 不能同时发生，交集为空；
对立：非此即彼，和为样本空间，交集为空；
独立：A 发生不影响 B，满足 P (AB)=P (A) P (B)。

这里有个关键结论：互斥一般不独立，独立一般不互斥，除非其中一个事件概率为 0。

核心公式包括：

条件概率：P (B|A)=P (AB)/P (A)
乘法公式：P (AB)=P (A) P (B|A)=P (B) P (A|B)
全概率公式：由因推果，把所有原因的概率加总得到结果总概率
贝叶斯公式：由果推因，已知结果反推某个原因的概率

2. 一维随机变量及常见分布

随机变量把事件量化，用分布函数 F (x)=P (X≤x) 描述整体概率。它单调不减、右连续，两端极限分别为 0 和 1。

随机变量分两类：

离散型：用分布律描述，常见 0-1 分布、二项分布、泊松分布；
连续型：用概率密度 f (x) 描述，分布函数是密度的积分。

重点分布：

均匀分布：区间内概率均等；
指数分布：具有无记忆性，常用于寿命模型；
正态分布：最常用，可标准化为标准正态 N (0,1)，是查表计算的基础。

3. 多维随机变量、独立性与相关性

多维变量看联合分布，把另一个变量全部 “积掉” 就得到边缘分布。

独立判定：联合分布 = 边缘分布的乘积；
协方差与相关系数：衡量线性相关程度，相关系数被标准化到 [-1,1]。

高频易错点：独立一定不相关，但不相关不一定独立，只有二维正态分布两者等价。

4. 随机变量数字特征

期望：加权平均值，满足线性性质，不管是否独立都可拆分；
方差：衡量波动大小，公式为 D (X)=E (X²)-[E (X)]²；
独立时，和的方差 = 方差之和。

常见分布期望方差速记：

二项分布：E=np，D=np (1-p)
泊松分布：E=λ，D=λ
均匀分布：E=(a+b)/2，D=(b-a)²/12
指数分布：E=1/λ，D=1/λ²
正态分布：E=μ，D=σ²

5. 大数定律与中心极限定理

切比雪夫不等式：给出概率的上界估计；
中心极限定理：大样本下，独立同分布变量的均值近似正态分布，这就是自然界大量现象服从正态分布的原因。

二、数理统计

1. 抽样分布与三大统计分布

数理统计从样本反推总体。统计量是不含未知参数的样本函数。三大抽样分布：

卡方分布：标准正态的平方和；
t 分布：形似正态，尾部更厚，大样本趋近正态；
F 分布：两个卡方分布除以自由度的比值。

2. 参数估计

参数估计分点估计和区间估计：

矩估计：用样本矩代替总体矩列方程求解；
极大似然估计：让样本出现的概率最大，步骤是写似然函数→取对数→求导→解方程。

估计量有三个评价标准：无偏性、有效性、相合性。

区间估计用枢轴量法，正态总体方差已知用 Z 统计量，方差未知用 t 统计量。

3. 假设检验

假设检验基于小概率原理：小概率事件在一次试验中几乎不发生。

步骤：提假设→构造统计量→确定拒绝域→计算并决策。

两类错误：

第一类弃真：原假设为真却拒绝，概率 α；
第二类取伪：原假设为假却接受，概率 β。
固定样本量时，α 和 β 此消彼长，同时减小需要加大样本量。

4. 一元线性回归分析

模型：Y=β₀+β₁X+ε，误差服从正态分布。

用最小二乘法最小化残差平方和，得到最优拟合直线。

用 t 检验判断线性关系是否显著，R² 越接近 1，拟合效果越好。

三、专业英语高频考点

核心词汇：

Probability Distribution、Mean、Variance、Standard Deviation、Hypothesis Testing、Confidence Interval、Correlation and Regression。