AI Podcast | 小宇宙 - 听播客，上小宇宙

11已订阅

AI Podcast

邬勇

单集更新

节目详情

AI Radio FM - 3FS 文件系统深度解析
深入探讨 3FS 文件系统的设计、实现和优化，包括其组件、文件系统接口、元数据存储、块存储系统以及故障检测和数据恢复机制。
7分钟 · 1 年前
6
0
Fire-Flyer AI-HPC：深度学习的软硬件协同设计
本次播客深入探讨了DeepSeek-AI的Fire-Flyer AI-HPC架构。这是一个专为深度学习设计的，具有成本效益的软硬件协同设计框架。我们讨论了其在硬件选择、网络拓扑、软件优化等方面的创新，以及如何实现高性能、低成本和低能耗。
4分钟 · 1 年前
1
0
AI解读Vision Mamba：视觉表示学习新星
本期播客深入探讨Vision Mamba (Vim)，一种新型通用视觉骨干网络，它采用双向Mamba块进行图像序列标记，并通过双向状态空间模型压缩视觉表示。Vim在ImageNet分类、COCO目标检测和ADE20k语义分割任务中表现出色，同时计算和内存效率显著提高。
4分钟 · 1 年前
2
0
AI Radio FM - Fire-Flyer AI-HPC：深度学习的软硬件协同设计
本期播客深入探讨了DeepSeek-AI的Fire-Flyer AI-HPC架构，这是一个专为深度学习设计的、具有成本效益的软硬件协同设计框架。讨论涵盖了从硬件选择、网络拓扑到软件优化（如HFReduce和HaiScale）的各个方面，以及如何通过这些创新实现高性能和低成本。
6分钟 · 1 年前
0
0
AI Radio FM - 高效人工智能实践
本期播客讨论了在工业应用中训练和部署高效大型语言模型（LLMs）的实用方法。主题包括知识蒸馏、模型压缩技术（如量化和剪枝），以及在实际部署中优化硬件和提高推理速度的策略。
4分钟 · 1 年前
0
0
AI Radio FM - Muon优化器深度解析
本期播客深入探讨了Muon优化器在大规模语言模型训练中的应用。Moonshot AI团队分享了他们如何通过添加权重衰减和调整参数更新尺度，成功将Muon扩展到3B/16B参数的MoE模型Moonlight的训练中。实验表明，与AdamW相比，Muon在计算效率上提高了约2倍。此外，播客还讨论了Muon的分布式实现，以及在预训练和监督微调阶段的表现。
3分钟 · 1 年前
0
0
AI Radio FM - Technology Channel
深入探讨MoBA（Mixture of Block Attention）技术，这是一种为长上下文LLM设计的新型注意力机制。
4分钟 · 1 年前
0
0
AI Radio FM - Technology Channel
深度解析MinMo：一款为无缝语音交互打造的多模态大型语言模型
4分钟 · 1 年前
1
0
AI解读SyncSpeech：低延迟高效双流文本转语音
本期播客深入探讨SyncSpeech，一种基于时间掩码Transformer的新型双流文本转语音（TTS）模型。SyncSpeech能够同步处理流式文本输入并生成语音，实现低延迟和高效率。
4分钟 · 1 年前
1
0
AI Radio FM - 深入探索Nomic Embed v2：首款混合专家文本嵌入模型
本期节目我们将深入探讨Nomic AI发布的Nomic Embed v2，这是业界首款通用混合专家（MoE）文本嵌入模型。我们将讨论其架构、训练方法、性能表现以及与同类模型的比较，并分析MoE架构在文本嵌入领域的有效性。
6分钟 · 1 年前
0
0
AI Radio FM - 揭秘LUCY：情感、自然、更智能的语音交互
本期播客深入探讨了腾讯优图实验室的最新研究成果LUCY，一个在情感控制、自然度和信息丰富度方面均有显著提升的端到端语音模型。通过精心策划的合成训练数据，LUCY不仅能理解并响应用户的情感，还能以自然流畅的风格进行对话，并利用外部工具回答实时问题。
6分钟 · 1 年前
6
0
AI Radio FM - Technology Channel
深入探讨Step-Video-T2V技术报告，涵盖视频基础模型、模型架构、训练策略、系统优化及未来发展方向。
5分钟 · 1 年前
0
0
AI Radio FM - 科技频道
深入探讨原生稀疏注意力机制（NSA）在长上下文建模中的应用和优势。
4分钟 · 1 年前
0
0
AI Radio FM - Technology Channel
深入探讨Step-Audio，首个生产就绪的开源智能语音交互框架。
5分钟 · 1 年前
0
0
AudioLM：音频生成的语言模型方法
我们介绍AudioLM，一个用于高质量音频生成并具有长期一致性的框架。AudioLM将输入音频映射到一系列离散标记，并将音频生成视为在此表示空间中的语言建模任务。
4分钟 · 1 年前
0
0

Latest podcasts about AI Technology and Papers.