#154. Chip Huyen：AI时代，手动检查数据竟是“性价比之王”？

📝 本期播客简介

主持人 Gergely Orosz 邀请到计算机科学家、作家 Chip Huyen。Chip 不仅是 O'Reilly 平台上备受欢迎的《AI Engineering》一书的作者，还曾在 Netflix 从事研究，担任过 Nvidia 生成式 AI 框架 NeMo 的核心开发者，并在斯坦福大学教授机器学习系统设计。在这期节目中，Chip Huyen 与 Gergely Orosz 深入探讨了人工智能工程的核心概念，清晰地剖析了它与传统机器学习工程的区别和演进。您将了解到构建AI应用的典型步骤，从模型选择、热门的检索增强生成（RAG）技术，到何时以及如何进行模型微调。Chip 还分享了软件工程师如何务实地进入AI应用开发领域，评估AI系统输出的常见方法与挑战，以及在AI项目初期应避免的常见误区。此外，她还对AI是否会取代软件工程师等热门话题给出了独到见解。

👨‍⚕️ 本期嘉宾

Chip Huyen，计算机科学家、作家，《AI Engineering》一书的作者。她曾在 Netflix 从事研究，是 Nvidia 生成式AI框架 NeMo 的核心开发者，也曾在 Snorkel AI 担任机器学习工程师，并创办了人工智能初创公司 Claypot AI。她曾在斯坦福大学教授机器学习系统设计课程，是全球人工智能工程领域最具影响力的专家之一。

📒 文字版精华

见微信公众号（点击跳转）

⏱️ 时间戳

00:00:00 开场白与本期内容概览

AI 工程的定义与嘉宾介绍

00:02:08 AI 工程与传统机器学习工程的区别初探

00:02:49 嘉宾 Chip Huyen 背景介绍

Chip Huyen 的著作《AI Engineering》

00:04:07 书籍的广度与深度及著书心得

00:05:13 著书过程中的大量研究与“体力活”

在快速发展的 AI 领域著书立说

00:07:11 关注基本原理，预判技术趋势 (如RAG、提示工程、上下文长度、多模态)

00:09:36 对提示工程和上下文长度趋势的预判

深入探讨 AI 工程

00:11:11 AI 工程与机器学习工程的差异详解

00:13:23 AI 工程流程：从产品到数据到模型，更侧重产品与工程

构建 AI 应用的核心技术与步骤

00:16:06 AI 系统中传统机器学习组件的重要性 (如路由、分类器)

00:17:47 构建AI应用的常用技术概览

00:18:21 从理解用户需求、制定评估标准到提示工程

00:20:00 RAG 技术详解：不止于向量搜索，传统检索与数据准备的重要性

00:21:50 数据准备的重要性与简单方法的优先

00:24:20 微调的考量与挑战：高成本、维护难度、可能被快速迭代的新模型超越

AI 解决方案的务实方法

00:26:16 结构化方法与渐进式部署，优先开拓新用例

00:27:34 案例：客户服务自动化的典型步骤 (公开渠道、路由优化、人机协作)

00:31:12 避免“万能锤”思维，专注解决实际问题，理解问题本质

应对 AI 浪潮中的 FOMO (错失恐惧症)

00:32:21 科技公司的 FOMO 现象及其正面意义

00:33:15 保持冷静，专注解决核心问题，避免追逐新闻表面

评估 AI 系统的挑战与方法

00:34:41 AI 越智能，评估越困难，人类评估面临瓶颈

00:36:47 评估方法：功能正确性 (如编码)、AI 即评委、比较评估

00:39:29 评估工具的局限性与用户理解的重要性 (案例：会议总结、税务软件)

00:42:01 手动检查数据的价值与持续的人工评估

AI 应用开发中的常见误区

00:44:15 误区一：在不需要时使用生成式 AI (案例：用电优化)

00:45:36 误区二：因简单问题或产品设计不佳而过早放弃 (案例：简历提取)

00:47:12 误区三：初期过度复杂化或滥用抽象层次过高、不成熟的新框架

软件工程师学习 AI 的方法

00:50:48 项目驱动学习与结构化学习的结合

00:52:07 教程学习的风险与提问、深入理解的重要性 (案例：import ibis)

00:54:08 观察自身工作，寻找 AI 应用点，解决个人痛点

AI 对软件工程未来的影响

00:55:27 AI 辅助编码，而非取代问题解决与工程设计

00:58:21 AI 可能助力构建更复杂的软件系统，提升工程师的生产力

AI 的未来应用前景展望

00:59:33 教育领域：培养提问能力，高效学习

00:59:50 娱乐领域：创作更具智力启发性的内容，媒介改编

01:01:33 企业组织结构的变革潜力 (如信息聚合对中层管理的影响)

快问快答与总结

01:02:06 常用编程语言 (Python, JavaScript) 与喜爱的 LLM (视用途而定)

01:03:30 自用 AI 工具 (论文研究助手) 与书籍推荐 (《复杂适应系统》、《自私的基因》、《反脆弱》)

01:05:45 总结与感谢，欢迎反馈

🌟 精彩内容

AI工程新范式: Chip Huyen 阐释了AI工程如何从传统机器学习工程演变而来，强调了从“产品到数据到模型”的流程转变，以及对工程和产品思维的侧重。

构建AI应用的实用路径: 详细拆解了从理解用户需求、提示工程、RAG（检索增强生成）技术的正确应用（强调数据准备和简单检索方法的重要性），到谨慎考虑模型微调的完整开发流程。

AI系统评估的深层挑战: 探讨了AI系统评估的复杂性，介绍了功能正确性、AI即评委、比较评估等方法，并强调了理解用户真实需求和持续人工审查的重要性。

避开常见陷阱: 指出了团队在构建AI应用时易犯的错误，如在不必要时使用AI、因初级问题过早放弃、初期过度复杂化以及盲目采用不成熟的框架。

工程师的AI学习之道: 提供了软件工程师学习AI的建议，倡导项目驱动与结构化学习相结合，鼓励批判性思维，并从自身工作流程中发掘AI应用点。

AI与软件工程的未来: Chip Huyen认为AI将增强而非取代软件工程师，自动化编码的物理行为，使工程师能专注于更复杂的问题解决和系统设计，推动软件向更高复杂度发展。

AI应用前景展望: 分享了对AI在教育（提升学习效率和提问能力）、娱乐（创造有深度的互动内容）以及企业（重塑组织结构，如信息聚合对中层管理的影响）等领域的积极展望。

🌐 播客信息补充

翻译克隆自：AI Engineering with Chip Huyen

本播客采用原有人声声线进行播客音频制作，也可能会有一些地方听起来怪怪的

使用 AI 进行翻译，因此可能会有一些地方不通顺；

如果有后续想要听中文版的其他外文播客，也欢迎联系微信：iEvenight