本期核心主题
聚焦浏览器 AI Agent 技术浪潮,解析获 Accel 领投 2200 万美元融资的 Kernel 公司,如何构建浏览器 AI Agent 的「操作系统级」基础设施,以及这一技术为何被视作软件分发与使用方式的下一次根本性变革。
本期亮点速览
- 资本焦点:Kernel 完成种子轮 + A 轮共 2200 万美元融资,Accel 领投,Y Combinator、Cintrifuse Capital 等机构跟投,Paul Graham(YC 创始人)、Solomon Hykes(Docker 创始人)等传奇开发者更是以天使投资人身份入局,足见行业对浏览器 AI Agent 赛道的看好。
- 关键类比:2008 年苹果 App Store 从 500 个简单应用(手电筒、假装喝啤酒工具)起步,最终催生 Uber、Instagram 等改变世界的产品;如今浏览器 AI Agent 正站在类似转折点,以「任务为导向」重构应用生态。
一、为什么浏览器 AI Agent 能成为「新 App Store」?
1. 传统 App Store 的「围墙困境」
- 应用孤岛:订机票、查天气、管日历需切换不同 App,无法自动同步数据(如航班信息同步至日历、订票前查目的地天气);
- 规则受限:开发者需遵守苹果等平台规则,生态封闭,应用间难以互通。
2. 浏览器 AI Agent 的四大核心优势
- 任务导向,降低认知负担:用户无需知道「用哪个 App」,只需用自然语言描述目标(如「计划下个月去巴黎旅行」),Agent 会自动跨网站完成航班预订、天气查询、日历标记等操作;
- 上下文感知,体验更个性化:可访问用户账户信息、浏览历史和偏好,自动登录网站、填写表单,处理复杂个性化任务;
- 开发者门槛更低:无需为多平台维护原生 App,只需有网站即可与 Agent 交互,生态更开放;
- 打破数据孤岛:能连接不同服务(如亚马逊查产品后,自动与其他电商比价),解决传统 App 「互不通信」的痛点。
二、Kernel :解决浏览器 AI Agent 的「基础设施难题」
1. 行业痛点:开发者的「拦路虎」
很多开发者想构建 AI Agent,却受困于基础设施问题:性能不稳定、运行不可靠、定价不合理、身份认证复杂,且互联网本就不是为 Agent 设计的环境。
2. Kernel 的核心解决方案:浏览器即服务(Browser-as-a-Service)
- 毫秒级启动:浏览器启动时间≤325 毫秒,避免用户等待,保障 Agent 快速响应;
- 可观察 + 可控:提供实时视图和回放功能,用户能查看 Agent 操作,发现问题可立即干预,解决「信任焦虑」;
- 安全认证系统:行业首个 Agent 认证平台,允许用户授予 Agent 特定受控权限,解决安全与信任核心问题(如避免 credentials 泄露给大模型);
- 其他能力:支持会话复用(保留 cookies、历史记录)、抗机器人检测、自动验证码破解、动态扩展浏览器数量等。
3. 团队基因:「完美技能组合」
- CEO Catherine Jue:曾在 Cash App 领导工程团队,亲身体验过 Agent 基础设施痛点,且是跆拳道世界冠军,具备「全力以赴」的创业精神;
- CTO Rafael Garcia:联合创立教育身份基础设施平台 Clever,在安全身份系统构建上经验丰富。
4. 客户验证:已落地生产环境
Cash App、Rye、OrangeSlice 及众多 YC 创业公司均在使用,例如用 Agent 自动化处理政府表格、大规模抓取行业职位信息等。
三、浏览器 AI Agent 的 5 大真实应用场景
- 自动化研究与数据收集:跨平台自动抓取职位发布、电商定价、竞争对手网站变化,某用户运行 10+ 并行 Agent,2 个月执行 1000+ 次任务,每周节省数小时人力;
- 潜在客户发现与数据丰富:销售团队用 Agent 爬取目录 / 参会名单找潜客、从 LinkedIn 拉取信息完善 CRM 数据,OrangeSlice 已启动 10000+ Agent 自动开发客户;
- 工作流程自动化:像「开放网络的 Zapier」,自动下载发票、定期提交表单、同步无集成应用的数据,某用户用其自动化处理繁琐的政府表格提交;
- 质量保证(QA)与测试:模拟真实用户行为(含不同地理位置),24/7 验证注册、结账等关键流程,Momentic AI 用其实现「AI 专属 QA 员工」;
- AI 驱动的体验:大语言模型 + 浏览器 Agent 结合,能阅读页面、总结内容、比较多来源信息并生成洞察,像「AI 实习生」执行多步骤跨网络任务。
四、为什么「现在是浏览器 AI Agent 的关键时刻」?
- 技术已成熟:大语言模型实时生成代码、视觉网络 Agent 模拟人类交互、计算机使用 Agent 接管点击操作,能力组合已能支持 Agent 像人类一样使用互联网;
- 生态待成型:与 iPhone App Store 「市场先到,技术后到」不同,浏览器 AI Agent 是「技术先到,市场后到」,目前缺的是生态系统构建,未来会出现 Agent 库、模板、分类市场;
- 分散≠劣势:当前 Agent 散落各处,无统一商店,但这种「无看门、无围墙」的状态,能促进多群体竞争,催生更开放创新的生态(对比 OpenAI GPT 店面,真正生态尚未完全形成)。
五、Kernel 的未来战略:瞄准「操作系统级平台」
- 强化身份权限层:推进 Kernel Agent Authentication,提供可审计性和范围控制,让 Agent 能安全处理企业敏感信息(如访问内部系统、处理客户数据);
- 支持 Computer Use Agent:让 AI 不仅能交互网页,还能控制计算机界面(打开本地 App、操作文件系统、运行命令行),扩展 Agent 能力边界;
- 标准化集成协议:扩展 Model Context Protocol(MCP)支持,让大语言模型能像调用工具一样访问浏览器,实现不同组件(自然语言理解、浏览器访问、API 调用)无缝协作;
- 与终端网站合作:帮助网站选择是否允许 Agent 访问、如何交互,平衡网站所有者与 Agent 开发者利益,构建可持续生态。
六、未来展望:浏览器 AI Agent 会带来什么?
1. 全新商业模式
可能出现「Agent 服务提供商」:不开发传统软件,而是提供专精领域的服务 Agent(如法律文档处理、财务分析),其他开发者通过 API 调用,形成「多层次 Agent 协作生态」。
2. 个人 Agent 助理普及
从「通用 AI 助手」走向「个性化专属 Agent」:能主动处理事务(如航班延误后自动改订、信用卡异常消费时联系银行),实现「设置后忘记」的自动化生活。
3. 挑战与应对
- 隐私安全:需建立行业标准和最佳实践,Kernel 认证系统是重要一步,但还需全行业共同努力;
- 网站接受度:部分网站可能担心 Agent 增加服务器负载或破坏商业模式,需通过合作建立互信(如 Kernel 与网站的合作计划),让网站认识到 Agent 能提升用户粘性。
七、给听众的行动建议
如果你是开发者、创始人或产品思考者,现在是进入浏览器 AI Agent 领域的最佳时机 —— 当前行业类似 iPhone App Store 早期,已有的应用多是数据管道、自动化流程等基础工具,真正改变世界的「Uber 级」Agent 产品还未出现,平台转变期正是创新黄金期。
互动话题
你认为浏览器 AI Agent 最可能先颠覆哪个行业?你期待用 Agent 解决生活中的什么问题?欢迎留言分享观点!
关于我们
「深思圈播客」每天更新,专注挖掘全球最新 AI 产品,分享实用出海增长策略,欢迎扫码订阅,一起探索 AI 驱动的未来世界。
