vol.200 - 2025年12月18日 OpenAI正式开放ChatGPT Apps应用提交
10分钟
·
21
·
0
- AI发展日新月异,产品和功能更新呈百花齐放之势。
- ElevenLabs将AI语音Agents平台整合进WhatsApp,触达其20亿月活用户市场。
- 企业可通过该平台部署AI语音助手,统一处理消息回复与电话呼入呼出,大幅简化运营流程。
- 字节跳动发布AI编程工具TRAE CN企业版,内部工程师使用率高达92%。
- 个人版注册用户已突破600万,能处理10万个文件和1.5亿行代码。
- 强调全链路加密和云端零存储,高度重视企业数据安全。
- OpenAI开放ChatGPT Apps应用提交,旨在将其打造成一个AI操作系统,并计划支持应用内购与订阅。
- YouTube推出基于Gemini 3的游戏制作工具Playables Builder,让普通用户也能通过文本和图片生成游戏。
- Google将Opal整合进Gemini,支持自然语言零代码构建AI助手,并提出“氛围编程”新概念。
- 推出Gemini 3 Flash模型,速度与智能兼备,并在Gemini App中免费提供。
- 医疗领域:MedChat多智能体诊断框架,通过“导演Agent”协调,旨在减少AI诊断的“幻觉”风险,提高可靠性。
- 视觉领域:对Nano Banana Pro模型的评估发现,其主观视觉质量高,但传统量化指标不如专家模型,揭示了生成模型评估的复杂性。
- 研究成果开源,推动学术界共同解决AI在专业领域的应用挑战。
- 国内大模型公司(壁仞、MiniMax、智谱等)进入IPO倒计时,标志着AI产业从“资本输血”转向“自我造血”。
- 全球首条人形机器人规模化电池产线在宁德时代投运,机器人“小墨”单日工作量提升3倍,成功率达99%以上。
- 行业正迎来资本化和产业规模化应用的重要拐点。
- 人才竞争:腾讯任命1998年出生的姚顺雨为首席AI科学家,反映了行业对顶尖人才的极度渴望。
- 代码“通货膨胀”:Greptile报告显示AI工具使代码产出量猛增76%,但代码质量的衡量仍是难题。
- Agent架构演进:开发正从“提示词工程”转向更严谨的“软件工程范式”,通过封装技能、分类加载提升效率。
- Agent并非万能,在频繁切换上下文时效率可能下降,且关键节点仍需人工确认。
- 实用技巧:分享了利用Git代码库作为背景信息提升Gemini内容创作效率的新玩法。
- 模型对比:GPT image 1.5在处理复杂指令上表现优于Nano Banana Pro。
- 未来预测:社交媒体将从追逐算法转向追逐品味和圈层领袖,催生“vibe经济”。
- Prompt优化:建议让AI进行反思和查漏补缺来迭代提升内容质量,但需注意次数,避免冗余。
- 结论:AI浪潮已至,驾驭它、平衡效率与挑战,是所有人共同的课题。