【AI日报】腾讯混元3D 2.1大模型开源;字节跳动AI Lab负责人李航卸任;OpenAI Codex 全新升级
1. **腾讯宣布混元3D 2.1大模型对外开源**
- 首个全链路开源工业级3D生成大模型,几何生成与PBR材质生成效果显著提升。
- 支持游戏、电影、电商等领域生成高质量3D角色、道具与产品模型,告别传统‘塑料感’。
- 全链路开源且部署友好,适配消费级显卡,适合个人与团队快速上手开发。
- 详情链接: 3d-models.hunyuan.tencent.com
2. **OpenAI Codex 全新升级: 让程序员轻松获取理想代码**
- 新增生成多种代码版本功能,满足不同需求,提升开发效率。
- 优化细节包括加载进度查看、取消操作及安装问题修复,操作更灵活。
- 基于codex-1模型优化,提高代码生成准确性,支持GitHub代码库提取。
3. **字节跳动AI Lab负责人李航卸任,Seed团队步入调整期**
- 李航卸任AI Lab负责人,转为劳务/顾问身份,标志着字节跳动AI Lab的重大人事调整。
- 自2020年起,AI Lab逐步转型为技术中台,并在2023-2024年将部分大模型团队并入Seed团队。
- 字节跳动AI Lab自2016年成立以来,历经多位负责人领导,逐步成为支撑字节跳动多项业务的技术核心。
4. **微软发布700个真实AI案例,探索智能化工作新模式**
- 微软展示了700个AI应用案例,涵盖金融、医疗、教育等多个行业。
- AI智能体通过自动化任务,显著减少工作时间,提升企业效率。
- 众多企业借助AI提升客户体验,推动业务增长与运营优化。
5. **微软AI重磅发布Code Researcher: 58%崩溃解决率震撼业界!**
- Code Researcher基于大型语言模型(LLM),能深度分析代码库和提交历史,追踪崩溃根本原因并生成修复补丁。
- 在Linux内核崩溃修复测试中,Code Researcher的崩溃解决率高达58%,远超SWE-agent的37.5%。
- 适用于多种大型代码库,为企业级软件维护提供高效解决方案,推动系统级软件开发自动化进程。
- 详情链接: www.microsoft.com
6. **AI监工上线! Observer AI让屏幕自动化更高效,解放你的双手**
- Observer AI通过高精度捕捉技术完整记录界面变化,确保数据无遗漏。
- 内置先进算法快速解析屏幕内容,识别任务完成情况或潜在问题。
- 支持调用MCP或自定义方案,自动执行下一步操作,实现闭环自动化。
- 详情链接: github.com
7. **Genspark AI 发布革新性AI Browser,开启智能网络浏览新时代**
- Genspark AI Browser内置AI代理,提供智能导航与内容分析,例如自动搜索全网最低价。
- 支持MCP Store模块化扩展,用户可通过定制化AI工具满足多样化需求。
- 适用于多种场景,包括学术研究、商业决策及内容创作,提升信息处理与任务自动化效率。
8. **麻省理工利用AI技术迅速修复15世纪名画,仅需三个半小时**
- 麻省理工开发新技术,通过AI修复名画,仅需三个半小时。
- 该技术将修复时间从数月缩短到几个小时,大幅提高效率。
- 采用可拆卸掩膜和数字地图,修复过程安全可逆,保护原画。
9. **蚂蚁集团和Inclusion AI联合推出Ming-Omni: 首个开源版多模态GPT-4o**
- 支持多模态输入融合处理,无需额外模型或特定任务微调,高效完成多样化任务。
- 提供语音与图像生成功能,支持方言理解、语音克隆及上下文感知对话,提升人机交互体验。
- 首个开源多模态模型,与GPT-4o匹敌,激励社区研究与开发,推动技术进步。
- 详情链接: lucaria-academy.github.io
10. **视频版AI换衣框架MagicTryOn,基于Wan2.1视频模型**
- MagicTryOn采用扩散变换器,显著提升视频虚拟试穿的时空一致性。
- 引入粗到细的服装保留策略,增强服装细节表现力。
- 在大幅度运动场景下表现优异,展现服装与人体动作的自然互动。
- 详情链接: vivocameraresearch.github.io
11. **字节跳动Seaweed APT2震撼发布! 实时互动AI视频生成,解锁3D虚拟世界新纪元**
- Seaweed APT2采用自回归对抗后训练技术,大幅降低计算复杂性,实现高效实时视频生成。
- 支持实时3D世界探索和互动虚拟人类生成,适用于虚拟主播、游戏角色等多种场景。
- 相比传统模型,Seaweed APT2在动作连贯性和场景多样性方面有显著提升,开启AI视频生成新篇章。
12. **OpenAI升级ChatGPT Search功能,提供更精准、更智能的响应**
- 新增图片搜索功能,支持多样化交互方式。
- Projects功能升级,助力高效管理对话和文件。
- 挑战谷歌霸主地位,提供更高效、人性化搜索体验。
13. **字节火山引擎澄清与老凤祥AI智能眼镜合作传闻**
- 火山引擎否认与老凤祥合作开发AI智能眼镜,但老凤祥展示的眼镜确实使用了豆包大模型。
- 老凤祥AI眼镜专为老年用户设计,具备多种实用功能如语音导航、实时翻译等。
- 豆包大模型作为公开产品,任何合规客户均可购买并应用到自己的设备中。

