节目介绍:
《AI Next》是微软亚洲研究院推出的一档利用 AI 技术制作的播客,内容聚焦 AI 前沿技术、科研趋势与社会影响。我们希望让听众在体验微软亚洲研究院最新研究成果的同时,聆听技术专家对 AI 发展的解读和深度洞察,在理解与思考中迎接 AI 的未来。
《AI Next》的第一季主要聚焦当今智能发展的核心议题,探索前沿趋势。本期节目,我们将目光投向近年来发展迅速的 agent(智能体)和 Agentic AI,与微软亚洲研究院首席研发工程师杨玉庆与高级研究员王韵,共同探讨 AI 如何从对话式“助手”演进为能够被人放心委托任务的智能“伙伴”。 Agentic AI 与传统软件、 AI 助手究竟有何本质不同?当 AI 开始理解人的思考过程,我们的工作方式、协作模式,乃至对智能的理解,又将会发生怎样的改变?图片信息构建相应的 3D 效果,让复杂的概念设计可以在立体空间中被“看见”。目前,VASA 和 TRELLIS 技术可在微软的 Copilot 产品中体验,VibeVoice 也已在 Hugging Face 上开源。三项技术的加持将为内容创造者和听众带来 AI 技术演进的真实体验。
《AI Next》的第一季主要聚焦当今智能发展的核心议题,探索前沿趋势。本期节目,我们将目光投向近年来发展迅速的 agent(智能体)和 Agentic AI,与微软亚洲研究院首席研发工程师杨玉庆与高级研究员王韵,共同探讨 AI 如何从对话式“助手”演进为能够被人放心委托任务的智能“伙伴”。 Agentic AI 与传统软件、 AI 助手究竟有何本质不同?当 AI 开始理解人的思考过程,我们的工作方式、协作模式,乃至对智能的理解,又将会发生怎样的改变?
嘉宾介绍:
杨玉庆博士
杨玉庆博士现任微软亚洲研究院首席研发工程师,带领系统与工程组专注于大模型系统和多模态系统的研究。他的研究兴趣包括大模型的高效计算和智能体系统的顶层设计等。相关研究成果多次发表于 OSDI、SOSP、EuroSys、ATC、CVPR、ICCV、NeurIPS 等国际顶级会议。杨玉庆分别于2006年和2011年获得复旦大学的学士学位和博士学位。
王韵博士
王韵博士是微软亚洲研究院的高级研究员。她的研究主要关注媒介如何作为一种基础结构,塑造人类的理解、表达、创造与协作方式,并进一步探索 AI 作为一种底层能力融入时,媒介与知识工作的基本形态如何发生变化。过去十余年中,王韵博士围绕数据分析、内容创作与知识工作等实践情境,持续推动不同媒介形式与表达结构的发展。她在复旦大学与香港科技大学获得了软件工程和计算机科学的学士与博士学位。她的相关研究成果曾发表于IEEE TVCG、ACM CHI、IEEEVIS、ACM UIST等国际顶级学术会议与期刊,同时,她也长期担任相关大会和期刊的程序委员会成员(Program Committee, Associate Chair)及审稿人。
本期技术名词:
Agentic AI:
如果把传统 AI 比作一个“问一句、答一句”的工具,那么 Agentic AI更像一个真正能托付事情的智能助理。用户只需交代目标,agent 就会自动查询所需的资料、调用所需的工具,并在过程中不断检查、纠错,直至交付结果。Agentic AI 不仅仅是执行指令,而是理解用户的意图并主动行动。
智能体强化学习(Agent Reinforcement Learning):
强化学习(Reinforcement Learning)是 AI 学习的一种方式,核心是试错学习。对于 agent 来说,当它成功完成一个复杂任务,或者采取了一个正确的步骤,它就会得到一个奖励信号,这个信号将帮助 agent 记住这个好的行为。
Agent Lightning:
Agent Lightning 是微软亚洲研究院推出的一款灵活可扩展的框架,专为弥合 agent 开发与优化的鸿沟而设计。它就像是 agent 的训练加速器,无需修改原来的程序,即可让 agent 在真实的交互数据中学习、优化,从而适应多轮对话、复杂任务和动态环境,有效提升 agent 在复杂场景中的性能与适应性。
元认知:
元认知原本是人类心理学的概念,指的是对自己认知过程的认知,比如人在解题时能意识到“我为什么卡在这一步?”“我之前的思路哪里错了?”如今,在与 agent 的交互中,我们可以把脑子里默默进行的思想活动告诉 AI,变成指挥 AI 的语言信号。这将让 agent 与我们对齐思考节奏,真正理解人在怎么思考。
Vibe coding:
Vibe coding 是随着 AI 发展出现的一种新的表达方式。它不再要求用户写出精确的代码,而是用自然语言甚至“感觉”来表达编程意图。比如,“我想要一个简约、大气的网页界面。”“简约、大气”这些听起来含糊的描述就是一种意图。Agent 能读懂这种高层语义,自动生成符合用户偏好的代码。
内容提要:
04:00 快速了解与 agent、Agentic AI 相关的核心概念
06:48 从工具到数字“伙伴”
09:32 AgenticAI 的三阶段进化
14:05 能够被人放心委托任务的智能“伙伴”需要具备哪些关键能力?
18:25 推进 Agentic AI 发展的主流研究路径有哪些?
21:28 Agentic Media:为协作而生的新型媒介
25:27 人机协作的方式正在发生变化
27:30 Agentic Media:为协作而生的新型媒介
32:46 如何让多个 agent 高效配合?
36:28 为什么 agent 不能是黑箱?
42:05 真正被需要的 agent 是什么样?
互动方式:
公众号/ 小红书/ 知乎/ 微博:微软亚洲研究院
相关阅读:
- GitHub Repo: agent-lightning
- 文章:Agent Lightning:零侵入强化学习,为任意AI智能体插上优化的翅膀
- 项目页面:Agent Lightning
- 项目页面:Agentic Media
- Blog: Agent Lightning: Adding reinforcement learning to AI agents without code rewrites
- Tech Report: Agent Lightning: Train ANY AI Agents with Reinforcement Learning
- 论文:Interaction, Process, Infrastructure: A Unified Framework for Human–Agent Collaboration
声明:
《AI Next》是微软亚洲研究院推出的一档利用 AI 技术制作的播客,旨在探索合成生成式技术在内容制作和传播中的新形式与可能性。节目中的语音均非真人录制,而是由研究技术原型合成。其中,嘉宾语音由 VibeVoice 技术基于既定文字内容以及嘉宾声音样本合成,宣传视频中的嘉宾人物头像由 VASA 技术基于音频内容以及卡通风格合成和渲染。
随着人工智能技术的快速发展,确保相关技术能被人们信赖是一个亟需解决的问题。微软主动采取了一系列措施来预判和降低人工智能技术所带来的风险。微软致力于依照以人为本的伦理原则推动人工智能的发展,早在2018年就发布了“公平、包容、可靠与安全、透明、隐私与保障、负责”六个负责任的人工智能原则(Responsible AI Principles),随后又发布了负责任的人工智能标准(Responsible AI Standards)将各项原则实施落地,并设置了治理架构确保各团队把各项原则和标准落实到日常工作中。微软也持续与全球的研究人员和学术机构合作,不断推进负责任的人工智能的实践和技术。
随着人工智能技术的快速发展,确保相关技术能被人们信赖是一个亟需解决的问题。微软主动采取了一系列措施来预判和降低人工智能技术所带来的风险。微软致力于依照以人为本的伦理原则推动人工智能的发展,早在2018年就发布了“公平、包容、可靠与安全、透明、隐私与保障、负责”六个负责任的人工智能原则(Responsible AI Principles),随后又发布了负责任的人工智能标准(Responsible AI Standards)将各项原则实施落地,并设置了治理架构确保各团队把各项原则和标准落实到日常工作中。微软也持续与全球的研究人员和学术机构合作,不断推进负责任的人工智能的实践和技术。
所有使用或转载本节目的个人与机构,在引用与传播时需明确标注相关内容“由AI技术合成”或者不得移除已有的标识,并避免任何可能引发误导或侵犯他人权益的使用方式。若您发现本节目内容或相关技术被非法使用,请通过微软安全响应中心(Microsoft Security Response Center)网站进行举报:msrc.microsoft.com

