【AI日报】EP.221 9月26 生数科技推出Vidu Q2;火山引擎推出炉米Lumi;通义千问开源Aishaobing的个人播客

【AI日报】EP.221 9月26 生数科技推出Vidu Q2;火山引擎推出炉米Lumi;通义千问开源

7分钟 ·
播放数133
·
评论数0

【技术突破】 🚀 生数科技发布 Vidu Q2:细微表情生成更真实

在图生视频细微表情与情感传达上实现显著提升,画面更自然、更生动。

支持图生视频、首尾帧生成与可调时长,为创意影像提供更灵活的制作能力。

【效率工具】 ⚙️ 火山引擎炉米 Lumi 支持视觉模型 LoRA 微调

首次支持豆包、即梦等同款视觉模型的 LoRA 微调,企业可快速定制视觉风格。

提供从图片到视频的全流程 AIGC 能力,助力高效构建生产线。

【行业动态】 📰 阿里云:通义千问开源300+模型,下载量突破6亿

云栖大会披露最新进展,展现开源生态与应用落地的强劲势头。

通义万象生成超3.9亿张图片、7000万+视频,数字内容能力持续攀升。

【开源项目】 🧩 百度开源 Qianfan-VL:多模态视觉理解模型三档规模

依托昆仑芯 P800,兼顾低功耗与高效训练,在 OCR 与教育场景表现突出。

3B/8B/70B 全系开放,GitHub 与 Hugging Face 同步面向开发者使用。

- 项目链接(如有):github.com

【行业动态】 📰 微软引入 Anthropic 模型扩展 Copilot Assistant

在保持与 OpenAI 紧密合作的同时,多元化引入 Anthropic 满足企业需求。

管理员启用后,企业可用 Anthropic 模型构建 AI 代理,并在多云环境运行。

【行业动态】 📰 OpenAI 在美国新建五个数据中心,推进“Stargate”算力

总投资约 5000 亿美元,目标算力接近 7GW,基础设施按周扩容。

Oracle 参与建设,阿比林数据中心扩容新增 600MW,支撑生成式 AI 加速发展。

【开源项目】 🧩 英伟达开源 Audio2Face:实时语音驱动面部动画

提供 SDK 与训练框架,支持离线渲染与实时流式,覆盖游戏与影视场景。

多家开发商已采用,显著提升虚拟角色真实感与制作效率。

- 项目链接(如有):build.nvidia.com

【AI模型】 🤖 Meta 发布 CWM:32B 参数代码世界模型支持沙箱推演

生成前先在沙箱模拟运行结果,快速定位错误并提升调试与安全性。

硬件要求高,需双 H100 与 RDMA 支持,适配高性能工程环境。

- 项目链接(如有):github.com