土豆世界观察 | 小宇宙 - 听播客，上小宇宙

做家务清晨洗漱

听播客，上小宇宙！

34已订阅

土豆世界观察

丁满123

单集更新

节目详情

【大模型】在某些简单任务上为什么会犯错
论文链接：arxiv.org
14分钟 · 2年前
12
0
【独立开发】程序员可以这样做搜索引擎优化SEO
博客链接：marclou.beehiiv.com
7分钟 · 2年前
8
0
【独立开发】从一行excel函数公式到4万美金月收入的创业
00:20 reddit论坛上的第一个帖子 03:27 产品爆发式增长 05:44 开发过程 07:06 产品定价 08:28 产品爆火后的发展 https://www.reddit.com/r/InternetIsBeautiful/comments/w2wdro/free_ai_bot_that_gives_you_the_excel_formula/ https://www.reddit.com/r/SideProject/comments/x47nzi/zero_to_350k_users_in_a_month_and_a_half/?utm_source=embedv2&utm_medium=post_embed&utm_content=post_body&embed_host_url=https://embed.notion.co/api/iframe https://www.successfulprojects.online/case-study-6-david-bressler-no-code-saas-formulabot/?utm_source=reddit&utm_medium=post
11分钟 · 2年前
10
0
独立开发者应该在项目初期跳过用户调研？
文章链接：https://www.indiehackers.com/post/skip-user-research-go-sell-02696f6b20 01:00 传统用户调研的步骤 03:00 直接开始销售产品的好处 06:57 需不需要至少有个产品效果图或者网站来展示想法？然后再开始销售？
13分钟 · 2年前
10
0
谷歌的通用游戏AI智能体-SIMA介绍
00:15 游戏环境中的通用AI智能体 00:25 SIMA的意义 01:00 SIMA尝试的游戏 02:30 游戏数据收集的两种方法 04:20 智能体的模型架构 06:00 如何让模型更“听话” 06:47 实验结果证明了智能体的可迁移性 07:30 语言指令的有效性 09:00 SIMA是哪四个词的组成 SIMA项目网站：https://deepmind.google/discover/blog/sima-generalist-ai-agent-for-3d-virtual-environments/ SIMA论文：https://arxiv.org/abs/2404.10179
10分钟 · 2年前
12
0
什么？！AI作图已经可以用线团织围巾了？多模态模型Mini-Gemini介绍
00:15 Mini-Gemini可以做什么 02:50模型架构 11:15合成更多数据帮助训练模型 13:40 更多的生成图像（实验结果）
20分钟 · 2年前
19
0
Hugging Face合成了千万级文本数据训练大模型
00:26 为什么合成数据在未来将会对大模型训练至关重要？ 01:13 Hugging face的博客 03:00 合成数据的源头 03:55 生成合成数据的提示词
7分钟 · 2年前
28
0
大模型领域的估值热潮：合理还是泡沫？
在本期播客中，我们分析了大模型公司为何获得高估值的逻辑( 00:45)，包括其在文本理解和生成能力方面的突出表现( 00:59)、盈利能力的展现( 02:01)、以及在搜索,视频生成领域的巨大潜力（ 04:41 ）。同时，我们也讨论了大模型估值可能过高的担忧（07:41），主要集中在实现通用人工智能（AGI）的可能性上（08:01）。我们探讨了支持和怀疑AGI实现的不同观点，以及大模型技术发展的当前瓶颈和未来展望。此外，我们还触及了人才流动对整个行业可能产生的影响 (20:30)，以及如果AGI在短期内不能实现，开源模型如何为小公司提供发展机遇( 22:10)。欢迎在评论区参与投票：你认为AGI会在五年内实现吗？
25分钟 · 2年前
14
0
OpenAI Sora背后最主要的技术-Diffusion Transformer论文介绍
00:12 Sora用到最主要的技术 00:27 扩散模型+转换器 00:48 将U-net替换成transformer 01:02 transformer处理图像的方法 01:16 adaptive layer normalization是什么 02:31 adaptive layer normalization的重要性 03:18 实验结果，Diffusion transformer的规模效应 Diffusion Transformer论文链接 https://arxiv.org/pdf/2212.09748.pdf
6分钟 · 2年前
51
0
当AI图像生成模型可以被控制：control net介绍
00:15 control net想实现的目标 00:57 融合已经被训练好的大模型以及加入可被训练的参数 01:35 control net的三个输入 01:53 到底该怎么控制control net? 02:46 语言描述的作用 03:15 control net是如何减少内存消耗的 04:00 实验部分 04:20 四个量化评估方法 05:25 对比实验 05:35 control net 参数初始化为0的意义 06:15 文字描述对模型的影响 control net原论文：https://arxiv.org/abs/2302.05543
7分钟 · 2年前
9
0
让大语言模型减少幻觉：检索增强生成（RAG）介绍
00:00 幻觉 01:13 检索增强生成 RAG 01:42 检索 03:08共同训练检索和生成两部分的模型 04:00 使用RAG生成文字的不同方法 05:00 自适应分配检索出文章的权重 06:30 RAG实验效果不好的情况 07:00 检索器的重要性 07:38 RAG可以与时俱进但大语言模型不可以 08:42 总结检索增强生成原论文：https://arxiv.org/pdf/2005.11401.pdf 大模型幻觉综述：https://arxiv.org/pdf/2311.05232.pdf
9分钟 · 2年前
453
0
世界币是不是web3时代的微信？
00:54 去中心化管理 01:23 世界币像不像微信 03:09 身份证明 03:31 身份证明需要满足的条件 04:16 构建身份证明的系统需要满足的特性 05:22 已有技术的局限性 06:42 虹膜识别 08:00 新用户注册流程 10:15 生态圈治理 14:22 代币 14:55 我对世界币的看法
19分钟 · 3年前
4
0
一些有趣的独立开发项目，创业公司和论文【20230711】
00:12 YC 营收前五十名中的三家年轻公司 https://www.ycombinator.com/blog/yc-top-companies-list-by-revenue 00:58 deel 03:16 Whatnot 04:20 Nowports 06:54 Inflection AI - https://www.forbes.com/sites/alexkonrad/2023/06/29/inflection-ai-raises-1-billion-for-chatbot-pi 09:15 独立开发项目 09:30 Vidcap 10:28 BlackMagic.so 11:39 PhotoAI.com 12:51 SiteGPT 14:47 两篇语言模型相关的论文 14:53 Did You Read the Instructions? Rethinking the Effectiveness of Task Definitions in Instruction Learning - https://arxiv.org/pdf/2306.01150.pdf 17:37 LONGNET: Scaling Transformers to 1,000,000,000 Tokens - https://arxiv.org/pdf/2307.02486.pdf 23:00 Threads
25分钟 · 3年前
60
1

一个关注技术和商业的播客

00:00

00:00