本期核心看点:
- 两个土耳其小伙如何在 LLM 热潮中 “反其道而行”,押注图像、视频生成赛道,3 年打造估值 15 亿美金的 AI 基础设施巨头?
- 从 Stable Diffusion 生成一张图需要 19 秒,到压缩至几秒内完成,fal 如何靠 “速度” 筑起技术护城河?
- 移民创业者的独特视角:为何说 “资源有限的经历” 反而成了他们的竞争优势?
- 当 OpenAI、Luma 等巨头纷纷入局视频生成,fal 凭什么成为 Canva、Shopify 等企业的 “幕后推手”?
嘉宾简介:
本期深度解析聚焦 fal 联合创始人 Burkay Gur 与 Gorkem Yurtseven—— 两位拥有深厚技术背景的土耳其移民,前者曾任职 Oracle、Coinbase,后者是 Python 核心贡献者。他们从解决自身遇到的 “AI 生成速度太慢” 痛点出发,带领 fal 在 12 个月内实现收入增长 60 倍,服务超 100 万开发者与 Canva、Perplexity 等 100 多家企业客户。
核心内容拆解:
- 起源:从 “无法忍受的 19 秒” 到技术突围2022 年底,Stable Diffusion 等图像生成模型惊艳登场,但生成一张图需 19 秒的延迟让技术出身的 Burkay 和 Gorkem 难以接受。
从编译器优化、GPU 利用率提升等底层技术入手,他们将生成时间压缩至几秒内,坚信 “延迟会扼杀创造力”—— 这成为 fal 的起点。
关键决策:将优化能力打造成 “可插拔系统”,新模型发布当天即可提供优化版 API,快速响应市场需求。 - 移民创业者的困境与优势身份限制:Burkay 曾因绿卡申请被 “锁定” 在岗位,体会到移民创业的灵活性困境;Gorkem 从波兰退学后,因 Twitter 上的 “技术共鸣” 加入 fal。
独特视角:全球化敏感度(不局限单一市场)、资源有限下的问题解决能力、对长期主义的坚持,成为他们突破硅谷内卷的关键。 - 在 AI 红海赛道中 “精准卡位”2023 年 LLM 热潮中,fal 面临抉择:跟风追逐大语言模型,还是专注图像、视频生成?
最终选择:聚焦垂直领域,拒绝 “全能型平台” 定位。理由是 “资源有限的初创公司,必须在细分领域建立不可替代的专业度”。
市场验证:2024 年 OpenAI 发布 Sora 后,视频生成模型井喷,fal 凭借早期技术积累快速适配,成为生态基础设施核心玩家。 - 技术护城河:不止于 “快”多云分布式架构:为解决 GPU 资源受限问题,自建跨云编排系统,将容器启动延迟从 5 秒降至毫秒级。
分布式文件系统:通过多层缓存(数据中心、节点、内存),大幅提升模型加载速度,远超单一云服务效率。
工作流解决方案:不止提供单模型 API,还支持多步骤链式操作(如图像去背景→分辨率提升→视频生成),满足企业级复杂需求。 - 商业模式:从工程师文化到 “收入导向”早期团队 28 人全是工程师,却坚持 “技术必须落地赚钱”:从第一天就推动付费模式,当前年化收入达 9000 万美元。
客户策略:工程师直接对接客户 Slack 群,平均每个客户群有 3-4 名技术人员实时响应,深度绑定 Canva、Shopify 等核心用户。
盈利模式:按输出计费(如视频每秒 0.095 美元、图像每百万像素 0.025 美元),兼顾灵活性与规模化收益。 - 未来:AI 视频时代的 “基础设施野心”行业判断:2025 年将成 “AI 视频年”,当前 Instagram、TikTok 上已有 1/3 内容由 AI 生成,且正从 “替代现有流程” 走向 “创造全新场景”(如实时个性化广告、虚构娱乐内容 “猫咪奥运会”)。
目标:成为生成媒体生态的 “水电煤”,让所有开发者通过 fal 快速调用模型、搭建应用,覆盖图像、视频、3D 等全场景。
创业者启示:
- 细分市场的 “快增长” 比 “大而全” 更重要:fal 选择的赛道初期小众,但年增长足以支撑指数级扩张。
- 技术深度与商业敏感度需并存:工程师直接参与销售,避免 “技术自嗨”;销售团队懂技术,才能精准对接客户需求。
- 长期主义的底气:在 LLM 最热时坚持视频生成,靠的是对 “媒体生成与文本生成同等重要” 的信念,而非短期流量追逐。
本期播客推荐:
适合关注 AI 基础设施、创业方法论、出海增长的听众。如需深入了解 fal 的技术细节或两位创始人的更多故事,可扫码订阅深思圈播客,获取完整访谈与行业分析。
