EP11 从零开始做大模型:Transformer变体与超参数优化 Part 2

EP11 从零开始做大模型:Transformer变体与超参数优化 Part 2

35分钟 ·
播放数127
·
评论数0

深入剖析LLM:Transformer_架构演进与实践精要