这些材料来自斯坦福大学CS336课程的首次讲座,该课程名为“从头开始构建语言模型”。本次讲座由Percy和Tatsu主讲,概述了课程内容和目标。课程旨在让学生端到端地理解构建语言模型的完整流程,涵盖数据、系统和建模方面。讲座强调了亲自动手构建的重要性,因为研究人员与底层技术的联系日益减弱。尽管前沿模型因其规模和成本而遥不可及,但学生仍将学习机制、思维模式和直觉,以在计算和数据预算有限的情况下构建最优模型。课程还将深入探讨标记化(特别是字节对编码)以及优化效率的系统方法。