注意:由于出现很多公式,ai在处理公式时不准确,具体公式需要自己看
第一部分:内容大纲
一、概率论
随机事件与概率基础
一维随机变量及常见分布
多维随机变量、独立性与相关性
随机变量数字特征
大数定律与中心极限定理
二、数理统计
抽样分布与三大统计分布
参数估计(点估计 + 区间估计)
假设检验原理与两类错误
一元线性回归分析
第二部分:具体内容
一、概率论
1. 随机事件与概率基础
概率论的起点是随机试验、样本空间和随机事件。我们重点理清三个易混淆的关系:
互斥:A 和 B 不能同时发生,交集为空;
对立:非此即彼,和为样本空间,交集为空;
独立:A 发生不影响 B,满足 P (AB)=P (A) P (B)。
这里有个关键结论:互斥一般不独立,独立一般不互斥,除非其中一个事件概率为 0。
核心公式包括:
条件概率:P (B|A)=P (AB)/P (A)
乘法公式:P (AB)=P (A) P (B|A)=P (B) P (A|B)
全概率公式:由因推果,把所有原因的概率加总得到结果总概率
贝叶斯公式:由果推因,已知结果反推某个原因的概率
2. 一维随机变量及常见分布
随机变量把事件量化,用分布函数 F (x)=P (X≤x) 描述整体概率。它单调不减、右连续,两端极限分别为 0 和 1。
随机变量分两类:
离散型:用分布律描述,常见 0-1 分布、二项分布、泊松分布;
连续型:用概率密度 f (x) 描述,分布函数是密度的积分。
重点分布:
均匀分布:区间内概率均等;
指数分布:具有无记忆性,常用于寿命模型;
正态分布:最常用,可标准化为标准正态 N (0,1),是查表计算的基础。
3. 多维随机变量、独立性与相关性
多维变量看联合分布,把另一个变量全部 “积掉” 就得到边缘分布。
独立判定:联合分布 = 边缘分布的乘积;
协方差与相关系数:衡量线性相关程度,相关系数被标准化到 [-1,1]。
高频易错点:独立一定不相关,但不相关不一定独立,只有二维正态分布两者等价。
4. 随机变量数字特征
期望:加权平均值,满足线性性质,不管是否独立都可拆分;
方差:衡量波动大小,公式为 D (X)=E (X²)-[E (X)]²;
独立时,和的方差 = 方差之和。
常见分布期望方差速记:
二项分布:E=np,D=np (1-p)
泊松分布:E=λ,D=λ
均匀分布:E=(a+b)/2,D=(b-a)²/12
指数分布:E=1/λ,D=1/λ²
正态分布:E=μ,D=σ²
5. 大数定律与中心极限定理
切比雪夫不等式:给出概率的上界估计;
中心极限定理:大样本下,独立同分布变量的均值近似正态分布,这就是自然界大量现象服从正态分布的原因。
二、数理统计
1. 抽样分布与三大统计分布
数理统计从样本反推总体。统计量是不含未知参数的样本函数。三大抽样分布:
卡方分布:标准正态的平方和;
t 分布:形似正态,尾部更厚,大样本趋近正态;
F 分布:两个卡方分布除以自由度的比值。
2. 参数估计
参数估计分点估计和区间估计:
矩估计:用样本矩代替总体矩列方程求解;
极大似然估计:让样本出现的概率最大,步骤是写似然函数→取对数→求导→解方程。
估计量有三个评价标准:无偏性、有效性、相合性。
区间估计用枢轴量法,正态总体方差已知用 Z 统计量,方差未知用 t 统计量。
3. 假设检验
假设检验基于小概率原理:小概率事件在一次试验中几乎不发生。
步骤:提假设→构造统计量→确定拒绝域→计算并决策。
两类错误:
第一类弃真:原假设为真却拒绝,概率 α;
第二类取伪:原假设为假却接受,概率 β。
固定样本量时,α 和 β 此消彼长,同时减小需要加大样本量。
4. 一元线性回归分析
模型:Y=β₀+β₁X+ε,误差服从正态分布。
用最小二乘法最小化残差平方和,得到最优拟合直线。
用 t 检验判断线性关系是否显著,R² 越接近 1,拟合效果越好。
三、专业英语高频考点
核心词汇:
Probability Distribution、Mean、Variance、Standard Deviation、Hypothesis Testing、Confidence Interval、Correlation and Regression。

