第209期 张雪 vs 张雪峰

第209期 张雪 vs 张雪峰

136分钟 ·
播放数1677
·
评论数17

这期我们聊了王老师和老庄最近参加行业会议听到的AI软件工程见闻,关于张雪和张雪峰的一些特别的思考,还有我们看到大语言模型研发与商业化的新趋势,当然还有4月的荐书(及其他)。

↓↓↓荐书单26-04↓↓↓

[音乐专辑] American Idiot
创作&表演:Green Day
发行:2004

通用人工智能:认知、教育与生存方式的重构
作者: 刘嘉
出版:中信出版社 2025

行为:暴力、竞争、利他,人类行为背后的生物学
Behave: The Biology of Humans at Our Best and Worst
作者:罗伯特·萨坡斯基 Robert M. Sapolsky
译者:吳芠
出版:Penguin Press 2017,八旗文化 2019

 

「后互联网时代的乱弹」节目由「声湃 WavPub」提供内容托管和数据服务支持。

展开Show Notes
置顶
本日阅读推荐,有昨天节目里提到文章的介绍:https://digest.soulhacker.me/digest/2026-04-19-digest/
TimoQ
TimoQ
4天前
17:29 听友群在哪里啊
soulhacker
:
节目公告有二维码,如果过期了就等会儿,新的在审核
TimoQ:已加入,二群
越贵的模型越容易用好,就和学历越高的人越容易用好是同一个道理。有些模型的确也不差,但它需要花更多的精力去驾驭它,所以社交网络上推荐大家用最牛的模型,其实也是害怕大家没办法驾驭那些既便宜又好用的模型。
1:12:25 之前我和庄老师的感觉是差不多的,觉得只要我把开发任务拆得足够细致和详细,所有的Agent工具应该都可以很好地完成,起码差距不大。但是最近在尝试过不同的Agent工具之后,我发现其实还是会有天差地别的差距。
首先是响应速度上的差距:一个简单的bug修复任务,耗时可能会相差5~10倍。甚至都不清楚他现在慢在了哪个环节,是慢在读取关联上下文上面,还是慢在了模型输出上面。
然后是对于开发计划的理解上面的差距,很容易会出现偏差,需要经常去纠正方向上的错误。加上因为响应慢的因素,从单一任务的效率上来说还没有我自己动手来的快。特别是我在同时开启多个终端并行执行不同的开发任务时这种差距会更明显。

最重要的一个是在任务的完成度上面,现在遇到不少的情况就是完成度低的问题,甚至有过说完成了xx任务,但检查的时候发现其实只完成了40~70%,甚至只有一个空目录的情况。

也不是说唯CC或者SOTA模型不可,只是在尝试多种工具和模型之后发现不管是Agent工具还是模型第一梯队和第二梯队之间的差距是非常大的。
冉昕
冉昕
7天前
208期呢?
soulhacker
:
小宇宙拦了,可以到B站或者其他平台听
李大大傻:被吞了呗,这里的审核一直很迷
DarkSun
DarkSun
7天前
批判AI应用三省六部制的那个文章叫什么名字呀?没搜索到
soulhacker
:
https://www.sagasu.art/p/three-ministries-six-departments-illusion-why-virtual-company-multi-agent-architecture-not-viable 和 https://www.sagasu.art/p/joint-progress-response-and-revision-to-sansheng-liubu-illusion
0xE0F
0xE0F
6天前
cool
HD500838v
HD500838v
6天前
本科专业和研究生专业都证明了一件事,冷门专业之所以冷门是有原因的。
July_777
July_777
7天前
20:10 校企的问题是,在大模型这一波明显分化之前,好像没人觉得校企合作有问题🤔
soulhacker
:
并不是,一直有问题,而且尝试过这类合作的大部分企业都清楚
HD40358x
HD40358x
7天前
45:17 张雪峰帮助的都是需要帮助的人,从功利角度给出方案我觉得挺好的。
HD115478q
HD115478q
7天前
idiot太出名了