【AI日报】EP.165 6月14 腾讯混元3D 2.1大模型开源;字节跳动AI Lab负责人李航卸任Aishaobing的个人播客

【AI日报】EP.165 6月14 腾讯混元3D 2.1大模型开源;字节跳动AI Lab负责人李航卸任

7分钟 ·
播放数107
·
评论数0

【AI日报】腾讯混元3D 2.1大模型开源;字节跳动AI Lab负责人李航卸任;OpenAI Codex 全新升级

1. **腾讯宣布混元3D 2.1大模型对外开源**

   - 首个全链路开源工业级3D生成大模型,几何生成与PBR材质生成效果显著提升。

   - 支持游戏、电影、电商等领域生成高质量3D角色、道具与产品模型,告别传统‘塑料感’。

   - 全链路开源且部署友好,适配消费级显卡,适合个人与团队快速上手开发。

   - 详情链接: 3d-models.hunyuan.tencent.com

2. **OpenAI Codex 全新升级: 让程序员轻松获取理想代码**

   - 新增生成多种代码版本功能,满足不同需求,提升开发效率。

   - 优化细节包括加载进度查看、取消操作及安装问题修复,操作更灵活。

   - 基于codex-1模型优化,提高代码生成准确性,支持GitHub代码库提取。

3. **字节跳动AI Lab负责人李航卸任,Seed团队步入调整期**

   - 李航卸任AI Lab负责人,转为劳务/顾问身份,标志着字节跳动AI Lab的重大人事调整。

   - 自2020年起,AI Lab逐步转型为技术中台,并在2023-2024年将部分大模型团队并入Seed团队。

   - 字节跳动AI Lab自2016年成立以来,历经多位负责人领导,逐步成为支撑字节跳动多项业务的技术核心。

4. **微软发布700个真实AI案例,探索智能化工作新模式**

   - 微软展示了700个AI应用案例,涵盖金融、医疗、教育等多个行业。

   - AI智能体通过自动化任务,显著减少工作时间,提升企业效率。

   - 众多企业借助AI提升客户体验,推动业务增长与运营优化。

5. **微软AI重磅发布Code Researcher: 58%崩溃解决率震撼业界!**

   - Code Researcher基于大型语言模型(LLM),能深度分析代码库和提交历史,追踪崩溃根本原因并生成修复补丁。

   - 在Linux内核崩溃修复测试中,Code Researcher的崩溃解决率高达58%,远超SWE-agent的37.5%。

   - 适用于多种大型代码库,为企业级软件维护提供高效解决方案,推动系统级软件开发自动化进程。

   - 详情链接: www.microsoft.com

6. **AI监工上线! Observer AI让屏幕自动化更高效,解放你的双手**

   - Observer AI通过高精度捕捉技术完整记录界面变化,确保数据无遗漏。

   - 内置先进算法快速解析屏幕内容,识别任务完成情况或潜在问题。

   - 支持调用MCP或自定义方案,自动执行下一步操作,实现闭环自动化。

   - 详情链接: github.com

7. **Genspark AI 发布革新性AI Browser,开启智能网络浏览新时代**

   - Genspark AI Browser内置AI代理,提供智能导航与内容分析,例如自动搜索全网最低价。

   - 支持MCP Store模块化扩展,用户可通过定制化AI工具满足多样化需求。

   - 适用于多种场景,包括学术研究、商业决策及内容创作,提升信息处理与任务自动化效率。

8. **麻省理工利用AI技术迅速修复15世纪名画,仅需三个半小时**

   - 麻省理工开发新技术,通过AI修复名画,仅需三个半小时。

   - 该技术将修复时间从数月缩短到几个小时,大幅提高效率。

   - 采用可拆卸掩膜和数字地图,修复过程安全可逆,保护原画。

9. **蚂蚁集团和Inclusion AI联合推出Ming-Omni: 首个开源版多模态GPT-4o**

   - 支持多模态输入融合处理,无需额外模型或特定任务微调,高效完成多样化任务。

   - 提供语音与图像生成功能,支持方言理解、语音克隆及上下文感知对话,提升人机交互体验。

   - 首个开源多模态模型,与GPT-4o匹敌,激励社区研究与开发,推动技术进步。

   - 详情链接: lucaria-academy.github.io

10. **视频版AI换衣框架MagicTryOn,基于Wan2.1视频模型**

    - MagicTryOn采用扩散变换器,显著提升视频虚拟试穿的时空一致性。

    - 引入粗到细的服装保留策略,增强服装细节表现力。

    - 在大幅度运动场景下表现优异,展现服装与人体动作的自然互动。

    - 详情链接: vivocameraresearch.github.io

11. **字节跳动Seaweed APT2震撼发布! 实时互动AI视频生成,解锁3D虚拟世界新纪元**

    - Seaweed APT2采用自回归对抗后训练技术,大幅降低计算复杂性,实现高效实时视频生成。

    - 支持实时3D世界探索和互动虚拟人类生成,适用于虚拟主播、游戏角色等多种场景。

    - 相比传统模型,Seaweed APT2在动作连贯性和场景多样性方面有显著提升,开启AI视频生成新篇章。

12. **OpenAI升级ChatGPT Search功能,提供更精准、更智能的响应**

    - 新增图片搜索功能,支持多样化交互方式。

    - Projects功能升级,助力高效管理对话和文件。

    - 挑战谷歌霸主地位,提供更高效、人性化搜索体验。

13. **字节火山引擎澄清与老凤祥AI智能眼镜合作传闻**

    - 火山引擎否认与老凤祥合作开发AI智能眼镜,但老凤祥展示的眼镜确实使用了豆包大模型。

    - 老凤祥AI眼镜专为老年用户设计,具备多种实用功能如语音导航、实时翻译等。

    - 豆包大模型作为公开产品,任何合规客户均可购买并应用到自己的设备中。