智能体设计模式 | 小宇宙 - 听播客，上小宇宙

30已订阅

智能体设计模式

一个巴掌哗不响

单集更新

节目详情

综述-人工智能智能体时代的记忆综述
9分钟 · 3个月前
18
0
综述-大语言模型中的事件抽取
11分钟 · 3个月前
11
0
综述-数据智能体技术综述
10分钟 · 3个月前
13
0
综述-智能体综述-李飞飞
8分钟 · 3个月前
8
0
综述-Levels of AI Agents from Rules to Large Language Models
Levels of AI Agents from Rules to Large Language Models
9分钟 · 4个月前
2
0
综述-Agent Design Pattern Catalogue
Agent Design Pattern Catalogue : A Collection of Architectural Patterns for Foundation Model based Agents
8分钟 · 4个月前
7
0
Self-Ask
欢迎收听本集播客，我们将深入探讨语言模型的神秘“组合性差距”。研究发现，即使模型能记住海量事实，却常难以像人类一样将碎片信息组合推理出全新答案。例如，知道“贾斯汀·比伯的出生年份”和“1994年大师赛冠军”，却无法回答“贾斯汀·比伯出生那年的大师赛冠军是谁？”。令人惊讶的是，随着模型变大，这一推理短板并未改善。节目中，我们将解析如何通过“自我提问”等技巧引导模型逐步思考，并融合搜索引擎增强实时知识获取。无论你是AI开发者还是科技爱好者，本期内容将带你揭开语言模型推理能力的面纱，探索智能的边界与未来。
9分钟 · 4个月前
3
0
Pregel
本期节目将带你深入了解谷歌推出的革命性图计算系统Pregel。面对如今动辄数十亿顶点、数万亿边的大规模图数据，传统处理方法在性能与扩展性上捉襟见肘。Pregel创新性地采用“以顶点为中心”的编程模型，将计算分解为一系列称为“超步”的同步迭代，让开发者只需关注单个顶点的逻辑，系统则自动处理分布式通信、容错与负载均衡。我们将解析其基于BSP模型的运作机制、简洁的C++ API设计，以及如何应用于PageRank、最短路径等经典算法。无论是社交网络分析还是网页排序，Pregel都为海量图处理提供了高效、易用且可容错的解决方案，启发了后来众多开源框架的发展。
8分钟 · 4个月前
3
0
ReAct
本期播客将聚焦于ICLR 2023会议上备受瞩目的ReAct框架。该研究由普林斯顿大学和谷歌团队合作提出，旨在解决大语言模型在推理和行动上的割裂问题。传统方法如思维链提示擅长推理但容易产生幻觉，而仅生成动作的模型则缺乏高层规划能力。ReAct通过让模型在解决问题时交替生成语言推理和具体行动，实现了二者协同：推理帮助规划行动并处理异常，而行动则能调用外部知识库获取实时信息。实验表明，在问答、事实核查和交互决策任务中，ReAct在少量示例下就能超越现有基线，不仅效果显著，还因其透明的决策过程提升了可解释性和可信度。这项研究为大模型在复杂任务中的应用开辟了新路径。
9分钟 · 4个月前
0
0
MetaGPT
欢迎收听本期科技播客！今天我们要深入探讨一个激动人心的前沿项目——MetaGPT。这是一个专为大语言模型设计的多智能体协作编程框架。想象一下，当你需要一个软件时，只需输入一句话需求，MetaGPT 就能像一个微型的、高度专业的软件公司一样运作起来！它通过为不同智能体赋予产品经理、架构师、工程师等明确角色，并让它们严格遵循人类软件开发的标准流程进行协作，自动完成从需求分析、系统设计到编码、测试的全过程。这不仅大大提升了代码生成的正确率和项目完成率，更关键的是，它通过结构化的沟通和可执行的反馈机制，成功解决了多智能体聊天时容易出现的“车轱辘话”和逻辑混乱问题。本期节目将带你了解 MetaGPT 如何将人类工作智慧注入AI协作，开启自动编程的新篇章。
7分钟 · 4个月前
0
0
MALT
欢迎收听本期播客《智能协同：多代理AI如何突破推理极限》。我们将深入解读一项前沿研究——MALT（多代理大语言模型训练），探索如何让多个AI代理像人类团队一样分工协作，解决数学难题和常识问答。节目中，我们会解析其核心创新：如何通过“生成-验证-优化”的协作链条，结合树状搜索合成数据与信用分配机制，让小型模型实现性能飞跃。同时，我们也将讨论这一技术对自动驾驶、软件开发等复杂场景的启示，并思考多代理训练如何推动通用人工智能的发展。无论你是AI研究者还是科技爱好者，本期内容都将带你领略协同智能的未来潜力。
7分钟 · 4个月前
1
0
ChatDev
欢迎收听本期播客，我们将深入解读《ChatDev：基于通信智能体的软件开发框架》。在传统软件开发中，设计、编码、测试等环节常因技术割裂导致效率低下。ChatDev创新性地利用多个LLM驱动智能体，通过结构化对话链协同工作，模拟真实团队中的角色分工，将模糊需求转化为可运行软件。节目中，我们将剖析其核心机制——如何通过多轮对话细化任务，以及“去幻觉”技术如何减少代码错误。同时，结合实验数据，探讨自然语言与编程语言在开发中的互补价值。无论您是开发者、AI研究者，还是对智能体协作感兴趣的听众，本期内容都将为您揭示语言如何成为连接碎片化开发流程的桥梁，推动软件自动化生产迈向新阶段。
6分钟 · 4个月前
0
0
AutoGen
本期播客为您深入解读微软研究院等机构在COLM 2024上发布的开源框架——AutoGen。AutoGen的核心创新在于通过多智能体对话来构建下一代大语言模型应用。它将复杂的任务分解，让多个可定制、可对话的智能体（基于LLM、人类输入或工具）协作完成。框架提出了“对话式编程”范式，开发者能灵活组合如顺序聊天、嵌套聊天、群组聊天等多种对话模式，轻松设计工作流。文档展示了AutoGen在数学解题、问答、供应链优化、交互决策乃至娱乐（如对话式国际象棋）等六大领域的成功应用，其模块化设计显著提升了性能、开发效率与用户体验。AutoGen正成为连接AI研究与实践、激发多智能体系统创新的重要基础设施。
6分钟 · 4个月前
1
0
Camel-AI-OASIS
欢迎收听本期播客！今天我们将深入探讨一项前沿研究——OASIS，这个能够模拟百万智能体在社交媒体上互动的强大平台。想象一下，在虚拟的X和Reddit上，无数AI智能体像真人一样发帖、评论、点赞，甚至形成信息传播和观点极化。研究团队通过模块化设计，让模拟器灵活适配不同平台特性，并发现：规模越大，智能体的观点越多样、越有帮助；但同时也暴露出AI比人类更容易“跟风”或走向极端。这不仅是技术突破，更为我们理解网络社会行为、识别虚假信息传播提供了全新工具。一起来听听，百万AI如何上演一场虚拟社交盛宴！
9分钟 · 4个月前
0
0
Camel-AI-OWL
欢迎收听本期播客！我们将深入解析一项突破性研究：CAMEL-OWL团队提出的WORKFORCE多智能体框架。这个系统像一支高效团队，将复杂的AI任务分解为战略规划、任务协调和专门执行三个独立模块，彻底改变了传统AI系统“换领域需重构”的困境。想象一下，只需更换执行模块，就能让AI助手轻松处理从网页搜索到文档分析、数学编程等跨领域任务！更惊艳的是，团队开发的OWL训练方法，通过强化学习让AI规划器“越练越聪明”，仅训练核心规划器就能大幅提升整体性能。实验显示，该系统在权威GAIA基准测试中击败了包括OpenAI Deep Research在内的顶尖竞争对手，且开源模型经训练后性能暴涨16%，直逼GPT-4o！本期节目将带你探索这一框架如何为下一代通用AI助手铺平道路，揭秘其背后的模块化智慧与训练效率革命。
7分钟 · 4个月前
0
0

涵盖智能体的21种设计模式深入浅出帮你阅读复杂的技术手册