【AI日报】EP.221 9月26 生数科技推出Vidu Q2；火山引擎推出炉米Lumi；通义千问开源

Aishaobing的个人播客

7分钟 ·10个月前

133

·

0

【技术突破】 🚀 生数科技发布 Vidu Q2：细微表情生成更真实

在图生视频细微表情与情感传达上实现显著提升，画面更自然、更生动。

支持图生视频、首尾帧生成与可调时长，为创意影像提供更灵活的制作能力。

【效率工具】 ⚙️ 火山引擎炉米 Lumi 支持视觉模型 LoRA 微调

首次支持豆包、即梦等同款视觉模型的 LoRA 微调，企业可快速定制视觉风格。

提供从图片到视频的全流程 AIGC 能力，助力高效构建生产线。

【行业动态】 📰 阿里云：通义千问开源300+模型，下载量突破6亿

云栖大会披露最新进展，展现开源生态与应用落地的强劲势头。

通义万象生成超3.9亿张图片、7000万+视频，数字内容能力持续攀升。

【开源项目】 🧩 百度开源 Qianfan-VL：多模态视觉理解模型三档规模

依托昆仑芯 P800，兼顾低功耗与高效训练，在 OCR 与教育场景表现突出。

3B/8B/70B 全系开放，GitHub 与 Hugging Face 同步面向开发者使用。

- 项目链接（如有）：github.com

【行业动态】 📰 微软引入 Anthropic 模型扩展 Copilot Assistant

在保持与 OpenAI 紧密合作的同时，多元化引入 Anthropic 满足企业需求。

管理员启用后，企业可用 Anthropic 模型构建 AI 代理，并在多云环境运行。

【行业动态】 📰 OpenAI 在美国新建五个数据中心，推进“Stargate”算力

总投资约 5000 亿美元，目标算力接近 7GW，基础设施按周扩容。

Oracle 参与建设，阿比林数据中心扩容新增 600MW，支撑生成式 AI 加速发展。

【开源项目】 🧩 英伟达开源 Audio2Face：实时语音驱动面部动画

提供 SDK 与训练框架，支持离线渲染与实时流式，覆盖游戏与影视场景。

多家开发商已采用，显著提升虚拟角色真实感与制作效率。

- 项目链接（如有）：build.nvidia.com

【AI模型】 🤖 Meta 发布 CWM：32B 参数代码世界模型支持沙箱推演

生成前先在沙箱模拟运行结果，快速定位错误并提升调试与安全性。

硬件要求高，需双 H100 与 RDMA 支持，适配高性能工程环境。

- 项目链接（如有）：github.com

在小宇宙打开