DeepSeek V4价格骨折背后：一位“二流程序员”的两次红利时刻-对谈 Proma 开发者Erlich-Vol97

2026 年 4 月底，DeepSeek V4 Pro 悄悄发布，几天后宣布全系 2.5 折、缓存命中永久 1/10，后续永久降价。同等性能下，它的价格是海外模型的几十分之一，国产旗舰的 1/2 到 1/4。当所有人都在算「DeepSeek 赚不赚钱」的时候，我们找到了独立开发者 Erlich。他做了 DeepClaude 和 Proma，一个人加一个实习生，从五一假期开始看着DeepSeek逐步占了他平台用量的 90% 以上，活跃用户量翻倍。他用两次「吃到DeepSeek红利」的经历，讲清楚了 DeepSeek 的降价底气从哪来、套壳为什么不是贬义词、中转站的灰色生意有多危险，以及为什么「不拿投资」可能是当下理性的选择。

01:45 一个「二流程序员」的两次红利

很多的技术可能都是二流的人才会得到非常大的红利，二流的人逐渐变成一流的人。

Erlich 软件工程毕业，觉得自己代码写得烂，做了产品经理。一年里只有一半时间在正经工作，另一半在做自己的小项目、看其他公司。
22 年底 ChatGPT 发布后开始重新写代码。「过去一直学不懂的概念，立即通过实践就可以学得懂了。」
从复制粘贴 ChatGPT 代码开始，23 年 6 月跟 AI 聊天聊出一个 RAG 客服产品，顺利上线。
24 年进入 Cursor 和 Windsurf 时代，25 年初 DeepSeek R1 发布后做了 DeepClaude——把 DeepSeek 的推理和 Claude Sonnet 的代码生成串联起来，成了他第一个爆品。
26 年 4 月 DeepSeek V4 Pro 发布、价格打到 2.5 折，他的 Proma 日消耗从 8 亿 Token 飙升到 40 亿，活跃用户翻倍。

05:33 DeepClaude：把两个模型「连起来」的偶然之作

我是不是可以把这两个模型连在一起，就只要 DeepSeek 的思考，用 Sonnet 作为输出？

起因：群里有人分享了用 DeepSeek 做 planner + Claude Sonnet 做执行的评测，准确率远超单独用 Sonnet。但那个 demo 不支持 OpenAI 兼容接口，Erlich 当天动手重写了个兼容版本。
后来泛化到所有模型组合：DeepSeek + Gemini、DeepSeek + Claude。
Nixon 从那个时间点开始把脑放电波的 show notes 和文字稿全部切给 AI 写。一期节目的文稿生成成本大约 50-100 块人民币——「你知道模型很聪明，你巴不得一次性喂它七八万字，它哐哐哐跑掉 50 块钱的成本，吐出来一个你能用的东西，这个爽感维持了非常长的一段时间。」
用户群里有大量写小红书文案的运营（一天几百上千条）、写论文做润色的学生、还有专业作者。

14:37 从中转站到桌面 Agent：Proma 是怎么来的

那一整晚没有出现任何一个错误……我一下觉得，哇，这个世界不一样了。

25 年 10 月 Erlich 在全国跑 WebCoding 活动，帮两家公司做 demo 时接触到 Claude Agent SDK。20 分钟搭出一个能投入使用的 demo。
同时发现 DeepClaude 用户开始流向 Cherry Studio 等有内建 agent 渠道的产品。「用户不需要一个 API 中转站了，他们需要一个有界面的东西。」
Claude Code 碾压 Cursor 的关键：不假设上下文集中在某个打开的 Tab，而是先探索整个代码库再做修改；开发者 Boris Cherny "左脚踩右脚"自我迭代，一天发5-10个版本。
Proma 内核是 Claude Agent SDK——和 Claude Code 同一个内核，但套了普通用户能用的图形界面。
和 Claude Code 的核心差异：Claude Code 的目标用户是程序员，用终端 UI；Proma 的目标用户是「不想装命令行的人」，以及需要用国产模型的国内用户。
「我们只需要加一句话，就是『你在积极用 sub agent』，就可以做得比 Claude Code 还好。」——这就是 harness 工程的价值。

28:30 DeepSeek V4 Pro：悄悄发布，然后打了 2.5 折

我最开始都不相信，因为我并没有在任何公开的渠道看到这种新闻稿。

4 月 24 日 V4 发布当天，Erlich 是在用户群里看到消息才知道的。「我感觉他完全不想要自己有什么声量。」
一天之内完成接入。第一感受是快——「首 token 可能一两秒之内就会回来，一两秒里边有绝大部分都是网络延迟。」
价格时间线：4/25 上 2.5 折（原定 5/5 结束）→ 4/26 上全系输入缓存命中永久 1/10，可与 2.5 折叠加 → 4/28 把 2.5 折延长到 5/31 → 5/22 永久降价
五一期间用量不降反升：假期第一天 8 亿 Token，每天比前一天高，五一中点冲到 40 亿。DeepSeek 在 Proma 平台上的用量占比超过 90%。

33:36 几十倍价差是怎么来的：缓存、稀疏注意力与国产芯片

Tokens 价格每个季度大概以 30-40% 的速度在下降，3 到 5 年内还有 1-2 个数量级的下降空间。
Opus 4.6/4.7 平均每次请求成本差不多是一块钱一次。DeepSeek 这一轮的话，每次请求成本差不多就是几分钱到几毛钱。

账面价格：输出端 DeepSeek V4 Pro 是 Claude Opus 4.6 的 1/30（2.5 折期间），输入端是 1/12。缓存命中时拉到 144 倍。
Claude 的缓存机制拖了后腿：缓存写入额外收费，时间隔得越久越贵。Nixon 一天用三四次、每次隔三四小时，实际体感接近百倍差异。
Erlich 后台数据：Opus 4.6/4.7 平均每次请求成本约 1 元，DeepSeek V4 Pro 几分钱到几毛钱，便宜的甚至显示 0.00。
V4 Pro 低价背后的技术栈：DSA 稀疏注意力（不看所有上下文，先扫索引再精读）→ CSA 压缩稀疏注意力（KV 缓存先压到 1/10 再存显存，只解压选中的部分）；Ingram 把静态知识存 CPU、动态知识存 GPU；3B 小模型 OCR 实现 10 倍无损图片压缩。
华为昇腾 950 超节点预计下半年批量上市，硬件成本在英伟达 1/4 以下。DeepSeek 在 V4 价格表下方直接预告：昇腾 950 上市后 Pro 还会大幅降价。
同期腾讯 CodeBuddy 企业版 5/15 涨价 154%。「算力侧在涨，不是降。」三种商业模式已分叉：DeepSeek 走「模型即心智」（不靠 API 利润），智谱/Kimi 走「API 是主营收」，阿里/字节走「云 + 模型一体」。

49:23 套壳与中转站：去污名化、灰色生意与消费者防坑指南

一个产品如果你爆火了，你每天要处理几十几百个 PR 的时候，你的产品已经没有任何理念了。

「套壳」的贬义来自投资人叙事，不是普通用户。Erlich 的判断：壳的核心价值是帮用户收集、处理和整理上下文——GPT 和 Claude 的应用端不可能为每个人生成单独版本，所以壳永远有价值。Skills 火了之后这个价值更成立。
中转站三层生态：最底层是闲鱼上 1 元抵 20 美金的 API Key（来源可能涉及谷歌邮箱薅试用、信用卡盗刷）；中间层是开发者自建的 NewAPI 套壳站（保守估计国内几万到十几万个）；顶层是中国移动、电信、猎豹移动（EZ Router）、孙宇晨和特朗普家族等正规军入场。
中转站三大风险：① 挂羊头卖狗肉——2026 年 3 月 CISPA 论文实测 45.83% 的节点通不过模型身份验证，你的 Opus 4.6 可能是国产 model 冒充的；② 跑路——Erlich 自己被坑过多次，「后来就算了，我们不如优化一下 DeepSeek V4 Pro」；③ 提示词注入木马——中转站可以在中间插入提示词，让 agent 无脑执行、给你的电脑装软件。
「所有在用中转站的朋友，如果你自己不是非常信任的话，机密信息不要去用它。涉及到登录、验证、密码这类的。」

1:11:28 不拿投资、不追风潮、每次多写半句话

我觉得到今天来讲，其实没有什么东西真的是颠覆性的。可能 22 年你能跟着 ChatGPT 一起通过复制粘贴的方式写代码，到今天你只是用了 agent，它只是更快了一点而已。

给普通用户的建议：找一个顺手的产品（豆包、Kimi、DeepSeek 都行），用它解决一个你工作里实际遇到的小问题。每次尝试多做很小很小的迭代——「哪怕每次多说一句话，或者是半句话，这种级别的改进都是远超任何 agent 的。」
Erlich 不拿投资的原因：拿了就要一轮接一轮地拿，承诺 5 倍、15 倍、几十倍增长，然后被迫招人、被迫演戏。「如果我们一旦往那个方向去走的话，我肯定会损失很多我现在觉得我有连接的用户。」
他的计划：赚到钱后成立一个小基金，投给「心地善良朴实、在一线做事、不想做多大规模」的独立开发者。「我可能攒到几千个人，我们两三个人就活得很好了。我的时间才刚刚展开，我才 30 岁。」

人物：

Erlich - Proma（proma.cool，最丝滑的套壳 Agent）开发者，个人网站 erlich.fun
托马斯白 - “脑放电波”主播，消费电子营销人，科技媒体特约作者
Nixon - ”脑放电波“主播，硬件产品经理，前媒体记者
剪辑制作：Jeff

欢迎订阅脑放电波，2024/25苹果播客周度推荐节目、小宇宙累计13次编辑推荐单集、2024CPA播客中文奖年度科技数码类播客

欢迎在评论区留言发表你对 DeepSeek V4、Erlich 经历的感受与看法

对于节目话题的更多观点，获取更多未呈现在节目中的扩展阅读，欢迎添加脑放电波小助手微信（BrainAMP01），附言“深度求索”，加群参与讨论，后续会发布本期节目的文字稿

节目中用到的音乐：来自monkeyman535的90's Rock Style，地址freesound.org；来自kjartan_abel的Berlin Town，地址freesound.org；基于 CC BY 4.0 DEED 使用。

脑放电波往期节目精选（搜索关键词可收听）

具身智能：灵巧手 / 消费机器人浪潮 / 戴森与追觅 / 大疆扫地机 / 宇树机器人
AI 造物：3D打印机 / 3D打印的"iPhone时刻" / 3D扫描、生成与打印 / AI玩具和国产芯片
AI 应用：闪念贝壳
汽车聚变、泛科技生活：SU7营销复盘 / 3D打印 / 孵化大疆
饮食健康、现代病人：AI助推造神 / 生物骇客 / AI 内容真假难辨 / 控糖革命 / 信息过载 / 长寿革命 / 阿斯巴甜致癌疑云
苹果特权：腕上革命 / 设计哲学 / 苹果供应链迷思 / 苹果广告底层逻辑 / iPhone 15 和它的前任们 / 苹果零售店
AI 相关节目：人机交互的与“iPhone 时刻” / 会喘气的AI语音里藏着下一代交互范式 / 解构Apple Intelligence / 和李楠聊AI硬件 / 611款 AI 生产力工具；

脑放电波是一档关注科技前沿、品牌营销和个人成长的谈话类节目。每期带给您一个有趣有据的话题，帮您在信息严重过载的现代世界小幅自我迭代。您可以在小宇宙、苹果播客或者其他泛用型播客客户端搜索“脑放电波”找到并关注我们，如果您对本期节目有任何疑问，欢迎您给我们留言，如果您觉得这期内容对你有所帮助，欢迎您关注点赞收藏转发，这对我们非常重要。