Nemotron百万上下文窗口赋能智能代理，金融AI实现长短期记忆对话恢复，超深神经网络层级结构挑战RL极限

以下内容由艾斯派索(www.aispresso.com.cn)出品

欢迎收听“艾斯派索AI资讯速递”。今天，我们精选六条备受关注的前沿动态，带来人工智能领域的最新突破和趋势观察，涵盖大模型、生成式AI代码、对话式金融AI记忆、强化学习创新、模型可解释性以及AI基础设施演进。

Nvidia近日正式发布Nemotron Super 3模型，专为打造大规模智能代理而设计。在处理复杂任务时，这款模型具备了出色的推理能力以及高效的数据处理速度，凭借1200亿参数和混合专家架构，实现了吞吐量和精度的双重飞跃。Nemotron Super 3通过百万级上下文窗口完整保留工作流状态，在推理时仅激活部分参数，大幅降低算力消耗。结合新一代Blackwell GPU和NVFP4精度，推理效率较以往显著提升，确保了对于搜索、生成式编码、生物科学等高需求应用的支持。此举也为各行业的自动化流程提供了坚实的底层动力。

人工智能代码的安全性和准确性一直是行业焦点。Axiom Quant这家初创公司近期完成2亿美元新一轮融资，估值已达16亿美元。Axiom专注于利用Lean语言进行形式化验证，用严格的数学证明确保AI生成代码的功能与安全。公司推出的“确定性AI”产品，曾在国际数学竞赛中获得满分，实现了推理可机器校验，有效避免了代码“幻觉”问题。团队正在扩展其自我优化数据飞轮和形式化验证生态，力争让这种以数学保障的开发方式普及到每一家用到AI代码的企业中。

金融行业对对话式AI记忆能力有着明确需求。传统AI助手在完成一次对话后，通常会丢失前文信息，而实际财务分析往往涉及多轮对话与持续决策。基于LangGraph和Postgres的最新架构，通过持久化对话状态，实现中断与恢复，使得AI能像真实同事般协作，连续处理复杂的预算模拟和财务分析任务。该方案不仅保障了多轮交互、专业子代理协作，还带来了自动审计追踪与简洁可维护的工作流，为多领域金融AI应用注入了新动力。

强化学习领域近期实现重大突破。普林斯顿大学与华沙理工大学团队研究发现，将神经网络层级扩展到1024层，可以获得传统2至5层网络2到50倍的性能提升。通过Contrastive RL（对比式强化学习）算法，智能体不仅有效解决“反馈稀疏”难题，还在迷宫任务中出现了前所未有的复杂行为，包括垂直翻越障碍等高难度动作。该研究首次证明了超深网络结构在自主行为进化中的巨大潜力，为将复杂强化学习场景应用于现实提供了新思路。

理解和解释大型语言模型的决策逻辑，一直是AI安全与可控的核心议题。伯克利AI实验室的新算法SPEX与ProxySPEX，通过创新性消融实验与编码理论方法，在大规模场景下高效识别关键因素和输入之间的复杂交互。尤其是在特征、数据与模型组件的归因分析方面，这一框架显著提升了归因准确性，有助于查明模型输出背后的深层机制，也为跨学科研究和智能系统安全建设带来了强有力的工具保障。

随着AI从实验室走向大规模投产，底层基础设施正迎来快速演进。Nvidia正通过深度集成计算、存储、网络与软件，推动AI基础设施由分散的硬件向高效协同的“AI工厂”转变。高速网络、能耗管理、存储优化和边缘计算成为关注焦点。与此同时，AI基础设施布局正在全球范围内升级，驱动企业加速部署智能工厂和分布式边缘系统，为AI大规模落地扫清障碍。即将召开的GTC大会，将展示这一演进的前沿趋势，并引领行业探索未来AI生态的新格局。

以上为“艾斯派索AI资讯速递”带来的今日要闻。