
AI Radio FM - 3FS 文件系统深度解析深入探讨 3FS 文件系统的设计、实现和优化,包括其组件、文件系统接口、元数据存储、块存储系统以及故障检测和数据恢复机制。
Fire-Flyer AI-HPC:深度学习的软硬件协同设计本次播客深入探讨了DeepSeek-AI的Fire-Flyer AI-HPC架构。这是一个专为深度学习设计的,具有成本效益的软硬件协同设计框架。我们讨论了其在硬件选择、网络拓扑、软件优化等方面的创新,以及如何实现高性能、低成本和低能耗。
AI解读Vision Mamba:视觉表示学习新星本期播客深入探讨Vision Mamba (Vim),一种新型通用视觉骨干网络,它采用双向Mamba块进行图像序列标记,并通过双向状态空间模型压缩视觉表示。Vim在ImageNet分类、COCO目标检测和ADE20k语义分割任务中表现出色,同时计算和内存效率显著提高。
AI Radio FM - Fire-Flyer AI-HPC:深度学习的软硬件协同设计本期播客深入探讨了DeepSeek-AI的Fire-Flyer AI-HPC架构,这是一个专为深度学习设计的、具有成本效益的软硬件协同设计框架。讨论涵盖了从硬件选择、网络拓扑到软件优化(如HFReduce和HaiScale)的各个方面,以及如何通过这些创新实现高性能和低成本。
AI Radio FM - 高效人工智能实践本期播客讨论了在工业应用中训练和部署高效大型语言模型(LLMs)的实用方法。主题包括知识蒸馏、模型压缩技术(如量化和剪枝),以及在实际部署中优化硬件和提高推理速度的策略。
AI Radio FM - Muon优化器深度解析本期播客深入探讨了Muon优化器在大规模语言模型训练中的应用。Moonshot AI团队分享了他们如何通过添加权重衰减和调整参数更新尺度,成功将Muon扩展到3B/16B参数的MoE模型Moonlight的训练中。实验表明,与AdamW相比,Muon在计算效率上提高了约2倍。此外,播客还讨论了Muon的分布式实现,以及在预训练和监督微调阶段的表现。
AI Radio FM - Technology Channel深入探讨MoBA(Mixture of Block Attention)技术,这是一种为长上下文LLM设计的新型注意力机制。
AI Radio FM - Technology Channel深度解析MinMo:一款为无缝语音交互打造的多模态大型语言模型
AI解读SyncSpeech:低延迟高效双流文本转语音本期播客深入探讨SyncSpeech,一种基于时间掩码Transformer的新型双流文本转语音(TTS)模型。SyncSpeech能够同步处理流式文本输入并生成语音,实现低延迟和高效率。
AI Radio FM - 深入探索Nomic Embed v2:首款混合专家文本嵌入模型本期节目我们将深入探讨Nomic AI发布的Nomic Embed v2,这是业界首款通用混合专家(MoE)文本嵌入模型。我们将讨论其架构、训练方法、性能表现以及与同类模型的比较,并分析MoE架构在文本嵌入领域的有效性。
AI Radio FM - 揭秘LUCY:情感、自然、更智能的语音交互本期播客深入探讨了腾讯优图实验室的最新研究成果LUCY,一个在情感控制、自然度和信息丰富度方面均有显著提升的端到端语音模型。通过精心策划的合成训练数据,LUCY不仅能理解并响应用户的情感,还能以自然流畅的风格进行对话,并利用外部工具回答实时问题。
AI Radio FM - Technology Channel深入探讨Step-Video-T2V技术报告,涵盖视频基础模型、模型架构、训练策略、系统优化及未来发展方向。
AI Radio FM - 科技频道深入探讨原生稀疏注意力机制(NSA)在长上下文建模中的应用和优势。
AI Radio FM - Technology Channel深入探讨Step-Audio,首个生产就绪的开源智能语音交互框架。
AudioLM:音频生成的语言模型方法我们介绍AudioLM,一个用于高质量音频生成并具有长期一致性的框架。AudioLM将输入音频映射到一系列离散标记,并将音频生成视为在此表示空间中的语言建模任务。