嘿,朋友们,
第六期 AI-Nate Newsletter 来啦!
“一周一产品”的挑战进入第八周,我的创造焦点,从“赋能行动”转向了“赋能认知”。
在过去几周,我打造了一系列工具来提升效率、辅助创作。但最近我发现,当信息以前所未有的速度涌来时,真正的瓶颈不再是“做得慢”,而是“想得不够深”。我们需要的,不仅仅是更快的“手”,更是更锐利的“眼”和更清晰的“脑”。于是,一个为深度思考和研究量身定做的 AI 应运而生。这周的旅程,是关于如何创造一个工具来帮助我们更好地理解世界,并在这个过程中,如何更好地理解我们自己。
我们开始吧。
我最近在做什么:打造我的专属研究助理
第八周的挑战,源于一个纯粹的个人痛点:如何在一个新模型、新论文层出不穷的时代,高效地进行深度研究?
第八周:Research AI (research-ai.app)
这是个啥? 这是一个为研究者、学生和终身学习者量身打造的 AI 论文阅读和研究平台。虽然市面上的大模型都有研究功能,但它们无法针对“读论文”这一核心场景进行深度优化。Research AI 的目标就是解决这个问题。
核心体验: 我理想中的研究体验应该是这样的:
对话式阅读: 上传一篇论文,AI 成为我的专属导师,随时答疑解惑。
- 深度拓展:AI 能主动进行网络搜索,补充背景知识、关联相关论文,实现从点到面的认知扩展。
- 系统性总结:自动将整个研究过程——包括原始论文、补充资料和问答历史——沉淀为一份结构化的研究报告,方便日后查阅和分享。
最新进展: MVP 版本已正式上线!我加入了历史文件读取功能,方便在不同论文间无缝切换;优化了 PDF 文本选取,可以直接框选文字向 AI 提问;并将核心模型升级到了 GPT-5,大幅减少了幻觉和 Agent 执行错误。
欢迎试用: 强烈推荐大家用 OpenAI 最新发布的关于模型幻觉的论文 《Why Language Models Hallucinate》 来体验 Research AI,你会发现理解复杂概念变得前所未有的轻松。
个人平台更新:AI-Nate 安卓版正式完成!(ai-nate.com)
- 在带娃的间隙,我几乎重写了所有代码,终于完成了 AI-Nate 安卓版的开发。它是我个人的 AI 资讯和会员分享平台,将集结我的个人博客、精选学习资源,以及最新项目的更新和专属体验。我的目标是,将个性化系统、内容分享系统和媒体发布平台彻底打通,实现从想法到发布的全流程 AI 化。对于同样有内容创作需求的朋友,这意味着你只需专注于思想的火花,剩下的一切都可以交给 AI。
第九周挑战预告:
- 同时作为硬件和软件工程师,怎么能不挑战一款智能硬件产品?敬请期待!
“一周一产品”挑战全景回顾
第八周的挑战告一段落,整个旅程的版图也愈发清晰。以下是迄今为止的所有产品,每一个都是对 AI 应用边界的一次探索:
第七周:优化与打磨
- 专注于对现有产品进行迭代和完善,发布了 Kindred AI 安卓版并升级了多个应用。
第六周:Builder AI (builder-ai.app)
- 无代码 AI 智能体构建平台,让任何有想法的人都能轻松创造自己的 AI 应用。
第五周:Creator AI (creator-ai.app)
- 为创作者而生的 AI 智能体,自动完成文案、图片和视频的创作,将你从繁琐流程中解放。
第四周:Context AI (context-ai.app)
- 为你的 AI 助手提供完整的个人上下文,实现真正个性化、无缝的智能沟通。
第三周:Newsletter AI (newsletter-ai.app)
- 自动化你的 Newsletter 发布流程,让你能更专注于高质量内容的创作。
第二周:Kindred AI (kindred-ai.app)
- 专为亲子互动设计的 AI 故事生成器,让每个家庭都能拥有独特的睡前故事时间。
第一周:Momento AI (www.momentoai.app)
- 你的个人 AI 记忆库,帮你捕捉、组织并连接你所有的想法与灵感。
我最近在学什么:AI 相关的输入和思考
回归本源:重温斯坦福计算机视觉第一课
- 视频链接:Stanford CS231N Lecture 1: Introduction
- 内容简介:李飞飞教授的这堂课,像一部浓缩的史诗,从 5.4 亿年前的“寒武纪大爆发”讲起,阐述了“视觉”这一感官的出现,是如何成为驱动智能演化的原动力。课程回顾了计算机视觉从早期理论到被 ImageNet 数据集点燃,再到 2012 年 AlexNet 开启深度学习革命的完整历程。
- 我的思考:多年后重温这堂课,依然心潮澎湃。神经网络模型的发展,越来越像是在模拟我们的大脑结构。这让我不禁思考:我们大脑的潜力是否也被远远低估了?如果通过某种方式,每个人的大脑都能被训练和激发,达到 ChatGPT 那样的知识储备和推理能力,世界将会怎样?这听起来很科幻,但理解人工视觉的演化,或许正是我们理解自身智能潜能的一把钥匙。
解构 Nano Banana:谷歌的多模态“组合拳”
- 视频链接:从爆火Nano Banana,聊谷歌AI多模态五大主线布局(硅谷101)
- 内容简介:这期节目深入分析了前段时间爆火的 Nano Banana (Gemini 2.5 Flash Image) 模型,并系统梳理了谷歌在多模态领域的五大主线布局:Imagen(文生图)、Veo(文生视频)、Genie(互动世界生成)、创作者工具集,以及这一切背后的大脑——Gemini 多模态基础模型。
- 我的思考:我作为特邀研究员参与了硅谷101这期节目的录制。最大的感触是,当 AI 让创造变得如此“肆意妄为”,传统的生产模式正在被颠覆。过去我们熟悉的 PMF(产品市场契合)和商业模式,是建立在从创意到产品需要相当长时间和成本的基础上的。但当这个过程的效率提升 10 倍甚至更多时,我们原有的商业框架还能否承载?这是所有从业者都需要思考的问题。
我最近在见什么人:静养中的顿悟
这一周大部分时间在家休养,没有外出见人。但奇妙的是,正是在这种“静”的状态下,我前所未有地感受到了科技融入生活的力量。无论是用 AI 辅助研究,还是自动化内容发布,科技正无声地接管那些耗费心力的工作,将我解放出来,让我能更好地享受生命本身。
这正是我一直向往的状态:让 AI 帮我干活,我就可以去带娃和坐禅。
当科技的强大不再体现为冰冷的效率数字,而是转化为陪伴家人的温暖、和审视内心的宁静时,它才真正展现出最美妙的意义——让我们能更好地活在当下,体会生命的真谛。
我最近在思考什么:教学相长,在传道中悟道
在我的诸多身份中,“教师”或许是最让我引以为豪的一个。每周六晚上课前,娃都会对我说:“爸爸,你也是一个老师!”那一刻,我总是充满得意。
这段奇妙的旅程,源于十一年前对“费曼学习法”的一次实践。我要求自己每天花两小时学习新知识,并且要能用最简单的语言,解释给一个五岁的孩子听。在日复一日的“学”与“习”中,我逐渐体会到“知之者不如好之者,好之者不如乐之者”的真谛。我开始享受帮助每个人找到属于他们自己热情的那个过程。
这周,在看一部关于残疾人再就业的纪录片时,一句“关键是看你把他放在哪个位置上”深深地击中了我。我突然意识到,无论是教学生,还是设计 AI Agent,其本质都是一样的:找到那个“对的位置”,让独特的潜力得以最大化地发挥。 有些事情,坚持下来,不一定是为了追求某个宏大的意义,仅仅是“坚持”本身,就挺有意义的。
最后的想法
从打造一个更懂研究的 AI,到重温视觉智能的起源,再到体悟教学的真谛,这一周的线索最终都指向了一个共同的核心:我们创造的工具,终将反过来塑造我们自己。
我们正从一个“信息过载”的时代,迈向一个“认知升级”的时代。过去,我们追求的是如何更快地获取信息;未来,我们追求的将是如何更深地理解信息。
我开发 Research AI 的初衷,是想让 AI 成为一个更好的研究者。但在调试和优化的过程中,我发现自己也必须成为一个更好的研究者。我需要思考什么是好的提问方式,什么是有效的分析框架,什么是清晰的总结逻辑。我将我的思考模式教给 AI,而 AI 的反馈和表现,又反过来打磨了我的思考模式。
这就像教孩子一样。我们总想把最好的教给他们,但在这个过程中,被教育最深的,往往是我们自己。
AI 正在成为我们认知世界的一面镜子。我们赋予它结构,它还我们以清晰;我们教它探索,它带我们至远方。我们不仅在 build AI,我们更是在 build a better version of ourselves。
所以,我想把这个问题抛给大家:如果你可以设计一个专属 AI 来深度学习你最热情的一个领域,你希望它是什么领域的 AI?在这个共同学习和创造的过程中,你最期待发现一个怎样的自己?
欢迎直接回复,我很想听听你的想法。
祝好,
AI-Nate
ai-nate.com
