🏠 目录 概率统计:理论 × 实践周期表

概率统计:理论 × 编程实践 周期表

每 3–4 天一个小周期 · 适合考研备考 + 科研项目并行学习

每周学习循环(3–4天一个小周期)
📖
看理论
Stat110视频
+ 毛诗松教材
✏️
做纸上题
Stat110
Strategic Practice
💻
写模拟
Python 跑
蒙特卡洛验证
🔗
联系项目
找到与摔倒
检测的对应
📝
写一句话
用自己的话
总结这个概念
推荐资源矩阵
理论主线
Harvard Stat110 + 毛诗松教材
Blitzstein 讲直觉,毛诗松对应考研题型。Stat110 的 Strategic Practice 按概念组织,每套含题目+解答+作业,直接拿来用。
编程实践
probabilitycourse.com(免费)
配套 Stat110 同级别,有大量 Python 模拟章节,从 Bernoulli 到 Binomial 到连续分布,每个都有完整代码示例,可直接照着改。
进阶实战
Stanford CS109 Python 讲义
斯坦福概率课配套 Python,用 scipy.stats 处理分布的 PMF、CDF、均值、方差、采样,和之后做 ML 项目无缝衔接。
GitHub参考
buruzaemon/stats-110
Stat110 配套 Jupyter Notebook,涵盖联合分布、条件分布、协方差、变换等——卡住时可以参考别人的思路。
概率统计各模块:理论题 × 编程实践对照表
概念模块 纸上练习(考研对应) Python 实践任务 项目联系
古典概型
计数原理第1周
排列组合、取球问题、生日问题 模拟生日悖论:23人同生日概率 > 50%?跑10万次验证
条件概率
贝叶斯第2周
全概率公式、贝叶斯定理经典题 模拟医学检测:假阳性率如何影响"真的患病"概率 摔倒检测的误报率 = 假阳性问题,完全一致!
随机变量
期望方差第3周
离散分布期望推导、方差计算 模拟 Binomial / Geometric 分布,画 PMF 图与理论对比 传感器噪声建模(加速度计误差分布)
常见分布
正态/泊松第4周
正态标准化、泊松近似二项 用 scipy.stats 画正态/泊松 PDF,模拟 CLT 收敛过程 摔倒事件频率建模(稀有事件 → 泊松)
大数定律
中心极限第5周
切比雪夫不等式应用题 模拟样本均值收敛:n 从 10 增到 10000,画收敛曲线 模型评估时为何需要多折交叉验证
统计推断
假设检验第6周
t 检验、区间估计、p 值计算 模拟 A/B 测试:两组数据,用 scipy 做 t 检验,改变样本量看 p 值变化 改进模型后,怎么证明提升是显著的?
马尔可夫链
(选做)进阶
转移矩阵、平稳分布 模拟随机游走,验证平稳分布收敛 老人行为序列建模(站立→行走→摔倒)
实践示例
生日悖论(第1周实践)— 理论 vs 模拟的对照方式
先算理论值
n 人中至少两人同生日的概率:
P = 1 − (365/365)(364/365)···((365−n+1)/365)

n=23 时,手算得 P ≈ 0.507
→ 直觉上感觉不可思议
再写模拟验证
import numpy as np

随机生成 23 人的生日,检测是否有重复,重复 10 万次,统计比例

结果应约为 0.507
→ 亲眼看到数字,直觉被更新
实践节奏建议
已保存 ✓