2026 年 4 月底,DeepSeek V4 Pro 悄悄发布,几天后宣布全系 2.5 折、缓存命中永久 1/10,后续永久降价。同等性能下,它的价格是海外模型的几十分之一,国产旗舰的 1/2 到 1/4。当所有人都在算「DeepSeek 赚不赚钱」的时候,我们找到了独立开发者 Erlich。他做了 DeepClaude 和 Proma,一个人加一个实习生,从五一假期开始看着DeepSeek逐步占了他平台用量的 90% 以上,活跃用户量翻倍。他用两次「吃到DeepSeek红利」的经历,讲清楚了 DeepSeek 的降价底气从哪来、套壳为什么不是贬义词、中转站的灰色生意有多危险,以及为什么「不拿投资」可能是当下理性的选择。
一个「二流程序员」的两次红利
很多的技术可能都是二流的人才会得到非常大的红利,二流的人逐渐变成一流的人。
Erlich 软件工程毕业,觉得自己代码写得烂,做了产品经理。一年里只有一半时间在正经工作,另一半在做自己的小项目、看其他公司。
22 年底 ChatGPT 发布后开始重新写代码。「过去一直学不懂的概念,立即通过实践就可以学得懂了。」
从复制粘贴 ChatGPT 代码开始,23 年 6 月跟 AI 聊天聊出一个 RAG 客服产品,顺利上线。
24 年进入 Cursor 和 Windsurf 时代,25 年初 DeepSeek R1 发布后做了 DeepClaude——把 DeepSeek 的推理和 Claude Sonnet 的代码生成串联起来,成了他第一个爆品。
26 年 4 月 DeepSeek V4 Pro 发布、价格打到 2.5 折,他的 Proma 日消耗从 8 亿 Token 飙升到 40 亿,活跃用户翻倍。
DeepClaude:把两个模型「连起来」的偶然之作
我是不是可以把这两个模型连在一起,就只要 DeepSeek 的思考,用 Sonnet 作为输出?
起因:群里有人分享了用 DeepSeek 做 planner + Claude Sonnet 做执行的评测,准确率远超单独用 Sonnet。但那个 demo 不支持 OpenAI 兼容接口,Erlich 当天动手重写了个兼容版本。
后来泛化到所有模型组合:DeepSeek + Gemini、DeepSeek + Claude。
Nixon 从那个时间点开始把脑放电波的 show notes 和文字稿全部切给 AI 写。一期节目的文稿生成成本大约 50-100 块人民币——「你知道模型很聪明,你巴不得一次性喂它七八万字,它哐哐哐跑掉 50 块钱的成本,吐出来一个你能用的东西,这个爽感维持了非常长的一段时间。」
用户群里有大量写小红书文案的运营(一天几百上千条)、写论文做润色的学生、还有专业作者。
从中转站到桌面 Agent:Proma 是怎么来的
那一整晚没有出现任何一个错误……我一下觉得,哇,这个世界不一样了。
25 年 10 月 Erlich 在全国跑 WebCoding 活动,帮两家公司做 demo 时接触到 Claude Agent SDK。20 分钟搭出一个能投入使用的 demo。
同时发现 DeepClaude 用户开始流向 Cherry Studio 等有内建 agent 渠道的产品。「用户不需要一个 API 中转站了,他们需要一个有界面的东西。」
Claude Code 碾压 Cursor 的关键:不假设上下文集中在某个打开的 Tab,而是先探索整个代码库再做修改;开发者 Boris Cherny "左脚踩右脚"自我迭代,一天发5-10个版本。
Proma 内核是 Claude Agent SDK——和 Claude Code 同一个内核,但套了普通用户能用的图形界面。
和 Claude Code 的核心差异:Claude Code 的目标用户是程序员,用终端 UI;Proma 的目标用户是「不想装命令行的人」,以及需要用国产模型的国内用户。
「我们只需要加一句话,就是『你在积极用 sub agent』,就可以做得比 Claude Code 还好。」——这就是 harness 工程的价值。
DeepSeek V4 Pro:悄悄发布,然后打了 2.5 折
我最开始都不相信,因为我并没有在任何公开的渠道看到这种新闻稿。
4 月 24 日 V4 发布当天,Erlich 是在用户群里看到消息才知道的。「我感觉他完全不想要自己有什么声量。」
一天之内完成接入。第一感受是快——「首 token 可能一两秒之内就会回来,一两秒里边有绝大部分都是网络延迟。」
价格时间线:4/25 上 2.5 折(原定 5/5 结束)→ 4/26 上全系输入缓存命中永久 1/10,可与 2.5 折叠加 → 4/28 把 2.5 折延长到 5/31 → 5/22 永久降价
五一期间用量不降反升:假期第一天 8 亿 Token,每天比前一天高,五一中点冲到 40 亿。DeepSeek 在 Proma 平台上的用量占比超过 90%。
几十倍价差是怎么来的:缓存、稀疏注意力与国产芯片
Tokens 价格每个季度大概以 30-40% 的速度在下降,3 到 5 年内还有 1-2 个数量级的下降空间。
Opus 4.6/4.7 平均每次请求成本差不多是一块钱一次。DeepSeek 这一轮的话,每次请求成本差不多就是几分钱到几毛钱。
账面价格:输出端 DeepSeek V4 Pro 是 Claude Opus 4.6 的 1/30(2.5 折期间),输入端是 1/12。缓存命中时拉到 144 倍。
Claude 的缓存机制拖了后腿:缓存写入额外收费,时间隔得越久越贵。Nixon 一天用三四次、每次隔三四小时,实际体感接近百倍差异。
Erlich 后台数据:Opus 4.6/4.7 平均每次请求成本约 1 元,DeepSeek V4 Pro 几分钱到几毛钱,便宜的甚至显示 0.00。
V4 Pro 低价背后的技术栈:DSA 稀疏注意力(不看所有上下文,先扫索引再精读)→ CSA 压缩稀疏注意力(KV 缓存先压到 1/10 再存显存,只解压选中的部分);Ingram 把静态知识存 CPU、动态知识存 GPU;3B 小模型 OCR 实现 10 倍无损图片压缩。
华为昇腾 950 超节点预计下半年批量上市,硬件成本在英伟达 1/4 以下。DeepSeek 在 V4 价格表下方直接预告:昇腾 950 上市后 Pro 还会大幅降价。
同期腾讯 CodeBuddy 企业版 5/15 涨价 154%。「算力侧在涨,不是降。」三种商业模式已分叉:DeepSeek 走「模型即心智」(不靠 API 利润),智谱/Kimi 走「API 是主营收」,阿里/字节走「云 + 模型一体」。
套壳与中转站:去污名化、灰色生意与消费者防坑指南
一个产品如果你爆火了,你每天要处理几十几百个 PR 的时候,你的产品已经没有任何理念了。
「套壳」的贬义来自投资人叙事,不是普通用户。Erlich 的判断:壳的核心价值是帮用户收集、处理和整理上下文——GPT 和 Claude 的应用端不可能为每个人生成单独版本,所以壳永远有价值。Skills 火了之后这个价值更成立。
中转站三层生态:最底层是闲鱼上 1 元抵 20 美金的 API Key(来源可能涉及谷歌邮箱薅试用、信用卡盗刷);中间层是开发者自建的 NewAPI 套壳站(保守估计国内几万到十几万个);顶层是中国移动、电信、猎豹移动(EZ Router)、孙宇晨和特朗普家族等正规军入场。
中转站三大风险:① 挂羊头卖狗肉——2026 年 3 月 CISPA 论文实测 45.83% 的节点通不过模型身份验证,你的 Opus 4.6 可能是国产 model 冒充的;② 跑路——Erlich 自己被坑过多次,「后来就算了,我们不如优化一下 DeepSeek V4 Pro」;③ 提示词注入木马——中转站可以在中间插入提示词,让 agent 无脑执行、给你的电脑装软件。
「所有在用中转站的朋友,如果你自己不是非常信任的话,机密信息不要去用它。涉及到登录、验证、密码这类的。」
1: 不拿投资、不追风潮、每次多写半句话
我觉得到今天来讲,其实没有什么东西真的是颠覆性的。可能 22 年你能跟着 ChatGPT 一起通过复制粘贴的方式写代码,到今天你只是用了 agent,它只是更快了一点而已。
给普通用户的建议:找一个顺手的产品(豆包、Kimi、DeepSeek 都行),用它解决一个你工作里实际遇到的小问题。每次尝试多做很小很小的迭代——「哪怕每次多说一句话,或者是半句话,这种级别的改进都是远超任何 agent 的。」
Erlich 不拿投资的原因:拿了就要一轮接一轮地拿,承诺 5 倍、15 倍、几十倍增长,然后被迫招人、被迫演戏。「如果我们一旦往那个方向去走的话,我肯定会损失很多我现在觉得我有连接的用户。」
他的计划:赚到钱后成立一个小基金,投给「心地善良朴实、在一线做事、不想做多大规模」的独立开发者。「我可能攒到几千个人,我们两三个人就活得很好了。我的时间才刚刚展开,我才 30 岁。」
人物:
Erlich - Proma(proma.cool,最丝滑的 套壳 Agent)开发者,个人网站 erlich.fun
托马斯白 - “脑放电波”主播,消费电子营销人,科技媒体特约作者
Nixon - ”脑放电波“主播,硬件产品经理,前媒体记者
剪辑制作:Jeff
欢迎订阅脑放电波,2024/25苹果播客周度推荐节目、小宇宙累计13次编辑推荐单集、2024CPA播客中文奖年度科技数码类播客

欢迎在评论区留言发表你对 DeepSeek V4、Erlich 经历 的感受与看法
对于节目话题的更多观点,获取更多未呈现在节目中的扩展阅读,欢迎添加脑放电波小助手微信(BrainAMP01),附言“深度求索”,加群参与讨论,后续会发布本期节目的文字稿
节目中用到的音乐:来自monkeyman535的90's Rock Style,地址freesound.org;来自kjartan_abel的Berlin Town,地址freesound.org;基于 CC BY 4.0 DEED 使用。
脑放电波往期节目精选(搜索关键词可收听)
AI 造物:3D打印机 / 3D打印的"iPhone时刻" / 3D扫描、生成与打印 / AI玩具和国产芯片
AI 应用:闪念贝壳
饮食健康、现代病人:AI助推造神 / 生物骇客 / AI 内容真假难辨 / 控糖革命 / 信息过载 / 长寿革命 / 阿斯巴甜致癌疑云
苹果特权:腕上革命 / 设计哲学 / 苹果供应链迷思 / 苹果广告底层逻辑 / iPhone 15 和它的前任们 / 苹果零售店
AI 相关节目:人机交互的与“iPhone 时刻” / 会喘气的AI语音里藏着下一代交互范式 / 解构Apple Intelligence / 和李楠聊AI硬件 / 611款 AI 生产力工具;
脑放电波是一档关注科技前沿、品牌营销和个人成长的谈话类节目。每期带给您一个有趣有据的话题,帮您在信息严重过载的现代世界小幅自我迭代。您可以在小宇宙、苹果播客或者其他泛用型播客客户端搜索“脑放电波”找到并关注我们,如果您对本期节目有任何疑问,欢迎您给我们留言,如果您觉得这期内容对你有所帮助,欢迎您关注点赞收藏转发,这对我们非常重要。
