数值分析 (Numerical Analysis)
核心
- 浮点数精度
- 数值稳定性
- 梯度裁剪(Gradient Clipping)
- 学习率调度
大模型应用
防止梯度爆炸 / 消失
- 大模型层数深,计算量大,数值稳定性问题尤为突出。
BFloat16 / FP16 训练
- 理解不同精度浮点数对模型训练的影响。
优化器选择
- 某些优化器在数值上更稳定。
贡献者
Mira190贡献 2 次 · 最近 2025/09/13
github-actions[bot]贡献 1 次 · 最近 2026/05/11
longsizhuo贡献 1 次 · 最近 2026/05/06
这篇文章有帮助吗?
最近更新
Involution Hell© 2026 byCommunityunderCC BY-NC-SA 4.0
线性代数参考资料
内卷地狱技术文档页汇总线性代数核心学习资源:沉浸式线性代数互动教程、3Blue1Brown《线性代数的本质》系列视频与《线性代数的几何意义》PDF,侧重几何直观与可视化理解。适合CS/AI求职者、考研学生及希望夯实数学基础的开发者。
概率论与数理统计 (Probability & Statistics)
概率论与数理统计核心知识:随机变量、概率分布(高斯、伯努利、多项式)、贝叶斯定理、最大似然估计(MLE)与最大后验估计(MAP)。大模型应用包括语言建模中的条件概率、交叉熵损失函数、Top-k/Top-p采样及RLHF策略优化。适合AI/CS求职者、大模型开发与算法工程师系统复习。