AI-Nate 第六期：创造认知工具，成为更好的思考者

嘿，朋友们，

第六期 AI-Nate Newsletter 来啦！

“一周一产品”的挑战进入第八周，我的创造焦点，从“赋能行动”转向了“赋能认知”。

在过去几周，我打造了一系列工具来提升效率、辅助创作。但最近我发现，当信息以前所未有的速度涌来时，真正的瓶颈不再是“做得慢”，而是“想得不够深”。我们需要的，不仅仅是更快的“手”，更是更锐利的“眼”和更清晰的“脑”。于是，一个为深度思考和研究量身定做的 AI 应运而生。这周的旅程，是关于如何创造一个工具来帮助我们更好地理解世界，并在这个过程中，如何更好地理解我们自己。

我们开始吧。

我最近在做什么：打造我的专属研究助理

第八周的挑战，源于一个纯粹的个人痛点：如何在一个新模型、新论文层出不穷的时代，高效地进行深度研究？

第八周：Research AI (research-ai.app)

这是个啥？ 这是一个为研究者、学生和终身学习者量身打造的 AI 论文阅读和研究平台。虽然市面上的大模型都有研究功能，但它们无法针对“读论文”这一核心场景进行深度优化。Research AI 的目标就是解决这个问题。

核心体验： 我理想中的研究体验应该是这样的：

对话式阅读： 上传一篇论文，AI 成为我的专属导师，随时答疑解惑。

深度拓展：AI 能主动进行网络搜索，补充背景知识、关联相关论文，实现从点到面的认知扩展。

系统性总结：自动将整个研究过程——包括原始论文、补充资料和问答历史——沉淀为一份结构化的研究报告，方便日后查阅和分享。

最新进展： MVP 版本已正式上线！我加入了历史文件读取功能，方便在不同论文间无缝切换；优化了 PDF 文本选取，可以直接框选文字向 AI 提问；并将核心模型升级到了 GPT-5，大幅减少了幻觉和 Agent 执行错误。

欢迎试用： 强烈推荐大家用 OpenAI 最新发布的关于模型幻觉的论文《Why Language Models Hallucinate》来体验 Research AI，你会发现理解复杂概念变得前所未有的轻松。

个人平台更新：AI-Nate 安卓版正式完成！(ai-nate.com)

在带娃的间隙，我几乎重写了所有代码，终于完成了 AI-Nate 安卓版的开发。它是我个人的 AI 资讯和会员分享平台，将集结我的个人博客、精选学习资源，以及最新项目的更新和专属体验。我的目标是，将个性化系统、内容分享系统和媒体发布平台彻底打通，实现从想法到发布的全流程 AI 化。对于同样有内容创作需求的朋友，这意味着你只需专注于思想的火花，剩下的一切都可以交给 AI。

第九周挑战预告：

同时作为硬件和软件工程师，怎么能不挑战一款智能硬件产品？敬请期待！

“一周一产品”挑战全景回顾

第八周的挑战告一段落，整个旅程的版图也愈发清晰。以下是迄今为止的所有产品，每一个都是对 AI 应用边界的一次探索：

第七周：优化与打磨

专注于对现有产品进行迭代和完善，发布了 Kindred AI 安卓版并升级了多个应用。

第六周：Builder AI (builder-ai.app)

无代码 AI 智能体构建平台，让任何有想法的人都能轻松创造自己的 AI 应用。

第五周：Creator AI (creator-ai.app)

为创作者而生的 AI 智能体，自动完成文案、图片和视频的创作，将你从繁琐流程中解放。

第四周：Context AI (context-ai.app)

为你的 AI 助手提供完整的个人上下文，实现真正个性化、无缝的智能沟通。

第三周：Newsletter AI (newsletter-ai.app)

自动化你的 Newsletter 发布流程，让你能更专注于高质量内容的创作。

第二周：Kindred AI (kindred-ai.app)

专为亲子互动设计的 AI 故事生成器，让每个家庭都能拥有独特的睡前故事时间。

第一周：Momento AI (www.momentoai.app)

你的个人 AI 记忆库，帮你捕捉、组织并连接你所有的想法与灵感。

我最近在学什么：AI 相关的输入和思考

回归本源：重温斯坦福计算机视觉第一课

视频链接：Stanford CS231N Lecture 1: Introduction

内容简介：李飞飞教授的这堂课，像一部浓缩的史诗，从 5.4 亿年前的“寒武纪大爆发”讲起，阐述了“视觉”这一感官的出现，是如何成为驱动智能演化的原动力。课程回顾了计算机视觉从早期理论到被 ImageNet 数据集点燃，再到 2012 年 AlexNet 开启深度学习革命的完整历程。

我的思考：多年后重温这堂课，依然心潮澎湃。神经网络模型的发展，越来越像是在模拟我们的大脑结构。这让我不禁思考：我们大脑的潜力是否也被远远低估了？如果通过某种方式，每个人的大脑都能被训练和激发，达到 ChatGPT 那样的知识储备和推理能力，世界将会怎样？这听起来很科幻，但理解人工视觉的演化，或许正是我们理解自身智能潜能的一把钥匙。

解构 Nano Banana：谷歌的多模态“组合拳”

视频链接：从爆火Nano Banana，聊谷歌AI多模态五大主线布局（硅谷101）

内容简介：这期节目深入分析了前段时间爆火的 Nano Banana (Gemini 2.5 Flash Image) 模型，并系统梳理了谷歌在多模态领域的五大主线布局：Imagen（文生图）、Veo（文生视频）、Genie（互动世界生成）、创作者工具集，以及这一切背后的大脑——Gemini 多模态基础模型。

我的思考：我作为特邀研究员参与了硅谷101这期节目的录制。最大的感触是，当 AI 让创造变得如此“肆意妄为”，传统的生产模式正在被颠覆。过去我们熟悉的 PMF（产品市场契合）和商业模式，是建立在从创意到产品需要相当长时间和成本的基础上的。但当这个过程的效率提升 10 倍甚至更多时，我们原有的商业框架还能否承载？这是所有从业者都需要思考的问题。

我最近在见什么人：静养中的顿悟

这一周大部分时间在家休养，没有外出见人。但奇妙的是，正是在这种“静”的状态下，我前所未有地感受到了科技融入生活的力量。无论是用 AI 辅助研究，还是自动化内容发布，科技正无声地接管那些耗费心力的工作，将我解放出来，让我能更好地享受生命本身。

这正是我一直向往的状态：让 AI 帮我干活，我就可以去带娃和坐禅。

当科技的强大不再体现为冰冷的效率数字，而是转化为陪伴家人的温暖、和审视内心的宁静时，它才真正展现出最美妙的意义——让我们能更好地活在当下，体会生命的真谛。

我最近在思考什么：教学相长，在传道中悟道

在我的诸多身份中，“教师”或许是最让我引以为豪的一个。每周六晚上课前，娃都会对我说：“爸爸，你也是一个老师！”那一刻，我总是充满得意。

这段奇妙的旅程，源于十一年前对“费曼学习法”的一次实践。我要求自己每天花两小时学习新知识，并且要能用最简单的语言，解释给一个五岁的孩子听。在日复一日的“学”与“习”中，我逐渐体会到“知之者不如好之者，好之者不如乐之者”的真谛。我开始享受帮助每个人找到属于他们自己热情的那个过程。

这周，在看一部关于残疾人再就业的纪录片时，一句“关键是看你把他放在哪个位置上”深深地击中了我。我突然意识到，无论是教学生，还是设计 AI Agent，其本质都是一样的：找到那个“对的位置”，让独特的潜力得以最大化地发挥。 有些事情，坚持下来，不一定是为了追求某个宏大的意义，仅仅是“坚持”本身，就挺有意义的。

最后的想法

从打造一个更懂研究的 AI，到重温视觉智能的起源，再到体悟教学的真谛，这一周的线索最终都指向了一个共同的核心：我们创造的工具，终将反过来塑造我们自己。

我们正从一个“信息过载”的时代，迈向一个“认知升级”的时代。过去，我们追求的是如何更快地获取信息；未来，我们追求的将是如何更深地理解信息。

我开发 Research AI 的初衷，是想让 AI 成为一个更好的研究者。但在调试和优化的过程中，我发现自己也必须成为一个更好的研究者。我需要思考什么是好的提问方式，什么是有效的分析框架，什么是清晰的总结逻辑。我将我的思考模式教给 AI，而 AI 的反馈和表现，又反过来打磨了我的思考模式。

这就像教孩子一样。我们总想把最好的教给他们，但在这个过程中，被教育最深的，往往是我们自己。

AI 正在成为我们认知世界的一面镜子。我们赋予它结构，它还我们以清晰；我们教它探索，它带我们至远方。我们不仅在 build AI，我们更是在 build a better version of ourselves。

所以，我想把这个问题抛给大家：如果你可以设计一个专属 AI 来深度学习你最热情的一个领域，你希望它是什么领域的 AI？在这个共同学习和创造的过程中，你最期待发现一个怎样的自己？

欢迎直接回复，我很想听听你的想法。

祝好，

AI-Nate

ai-nate.com