EP 08. 【硅谷连线回放】MLOps: 下一个基础软件百亿美金战场?

EP 08. 【硅谷连线回放】MLOps: 下一个基础软件百亿美金战场?

100分钟 ·
播放数3073
·
评论数9

这是一期的主题或许有些硬核:我们连线硅谷一线科技公司,聊聊机器学习的工具栈,ML Infra (更准确来说,MLOps)。这是M小姐公众号上个月的一次直播回放,主题是《下一个infra 百亿美金战场在哪里?顶尖开源公司眼里的 MLOps 新时代》。

Hello World, who is OnBoard?!

欢迎来到 OnBoard!, 真实的一线经验,走心的投资思考,我们聊聊软件如何改变世界。

如果说过去5年是企业服务/SaaS的黄金年代(尤其在美国),那么,2021年绝对可以说是基础软件(主要是PaaS)的爆发之年。不过,在市场情绪急转直下的2022年,data infra 卷到发紫之后,一个infra领域的新战场已经在浮现。这就是这次我们要讨论的主题:MLOps(机器学习 DevOps 工具).

对于MLOps,一个比较被广为接受的定义是(来自Nvidia),MLOps是结合了ML(Machine Learning,机器学习),应用开发和IT infra的一整套流程和相应的工具链。包括了ML开发的准备-开发-部署整个过程中数据收集、模型开发、模型训练、实验管理、CI/CD,到生产环境部署、监控等一系列工具。

Data Infra (数据基础设施)已经出现了 Databricks, Snowflake 这样的百亿美金公司,而MLOps/ML Infra 似乎在爆发前夜。从上一个时代做平台化的 Datarobot, Dataiku, AWS SageMaker, 做标注的 Scale AI(估值7.5Bn)开始了细分市场的号角。各个领域的新兴独角兽开始涌现,比如基于自动化标注的AI平台 Snorkel AI(估值$1bn),做 NLP transformer 的Hugging Face (估值 $2Bn), 做实验管理的 Weights & Bias (估值$1Bn) , 分布式计算的Ray/AnyScale (估值$1bn)等等。

但是,要了解这个前沿趋势在硅谷实际的落地情况,这个转折点的背景,还有哪些机会,中国的创业者和创业公司可以如何参与到这个进程中甚至弯道超车,按照Monica 的习惯,当然是要请硅谷最一线的亲历者来聊聊!

这次我们请来的嘉宾的经验,横跨了Apple, Databricks 这样的大厂,也有Snorkel AI, BentoML这样的创业公司,从创业者到产品经理到开发者,他们的视角足够全面,一个多小时的分享,干货也是非常丰富。

直播的反响非常好,很多人要求回放,索性就上传到播客里,供大家回味。

中间因为腾讯视频号直播的连接问题,后面的音质可能不大好,请大家多担待。另外,嘉宾们日常工作都是英文环境,夹杂英文在所难免,尤其是一些专业名词,也希望大家体谅呀!一些名词注释我们也整理在节目介绍中了,真的尽力了!

想要了解更多背景知识和嘉宾介绍,请看这篇硬核宣传稿

关于主播

Monica:美元VC投资人,前 AWS 硅谷团队+AI创业公司打工人,公众号M小姐研习录 (ID: MissMStudy) 主理人 | 即刻:莫妮卡同学

重磅直播嘉宾

我们都聊了什么:

03:32  Monica 和几位嘉宾的自我介绍+Fun facts: 我们关注的 MLOps startups

14:02   如何理解 MLOps? 为什么企业需要关注 MLOps?

23:40  为什么现在 MLOps 开始得到了关注,主要的驱动力是什么?

37:01 新的 MLOps 产品早期 adopters 都是怎样的用户?

47:38 从技术提供方的 Databricks 到甲方 Apple, Cruise, 对于企业如何选择 MLOps 产品有什么新的思考?

53:31 BentoML 为何选择 model serving 作为创业切入点?

63:52 企业内部如何推动一个新的 MLOps 公司落地?决策链是怎样的?

68:39 Billion dollar question: MLOps 工具做单点还是平台?未来会如何整合?

77:54 MLOps 开源公司,如何设计商业化路径?

85:22 Yifan 如何看待单点还是平台,开源商业化两个问题(中间网络断掉了得补上……)

90:29 MLOps 目前还有什么挑战和最令人兴奋的机会?

97:23 新领域创业公司早期如何招到优秀的人才

我们提到的公司

推荐文章

需要了解的名词

  • Model serving: 模型服务
  • Model deployment: 模型部署
  • Feature Store:特征仓库
  • Snorkel Flow: Snorkel 开发的data-centric AI development platform,以数据为中心的AI开发平台

欢迎关注M小姐的微信公众号,了解更多中美连线对话!

M小姐研习录 (ID: MissMStudy)

大家的点赞、评论、转发是对我们最好的鼓励!希望你分享给对这个话题感兴趣的朋友哦~

如果你有希望我们聊的话题,希望我们邀请的访谈嘉宾,都欢迎在留言中告诉我们哦!

展开Show Notes
HD552979w
HD552979w
2022.5.26
03:28 有颜又有才的m小姐yyds!
莫妮卡同学
:
我害羞了!
汤不热啊
汤不热啊
2022.6.04
前期嘉宾对主理人抛出的几个问题回答的比较生硬也较被动。
貌似这一块没有门槛,难者不会,会者不难。就是拿现成的开源组合,而不是底层的创新。那么这一块的公司就没投资价值了,其他公司会很快赶上。打个不算特别恰当的比方,就比如StepN,其竞品很快就出现了很多,而且做的更好,直接导致StepN的庞氏结构导向死亡螺旋。
不得万一
不得万一
2022.5.24
☝️
sara_AuZa
sara_AuZa
2022.6.09
播客的链接有没有呀
EthereumX
EthereumX
2023.3.30
不错不错 多多益善
HD406102u
HD406102u
2022.5.28
有意思
不得万一
不得万一
2022.5.24
来了