【AI日报】EP.104 2月27 阿里开源文生视频模型万相2.1；幻方量化回应DeepSeek-R2模型提前发布

### AI日报新闻提要

1. **阿里开源文生视频模型万相2.1**

- Wan2.1模型在Vbench评测中以86.22%的成绩领先其他视频生成模型。

- 采用3D因果VAE模块，实现256倍无损视频隐空间压缩。

- 支持多种主流框架，开发者可通过Gradio快速体验。

- 详情链接: [github.com](github.com)

2. **360智脑发布Tiny-R1-32B**

- 该模型仅用5%的参数量接近Deepseek-R1的性能。

- 在数学、编程和科学领域表现优异，AIME2024评测中取得78.1分。

- 研发团队承诺公开完整模型仓库，并已上传至Hugging Face平台。

- 详情链接: [huggingface.co](huggingface.co)

3. **DeepSeek发布DeepGEMM库**

- DeepGEMM支持FP8通用矩阵乘法，适用于密集型和混合专家模型。

- 在NVIDIA Hopper GPU上实现超过1350TFLOPS的FP8计算性能。

- 核心代码仅300行，展现极高效率与简洁性。

- 详情链接: [github.com](github.com)

4. **百度“秒哒”开启用户邀测**

- 用户可通过邀测邮件访问秒哒，体验H5页面开发和网站开发等功能。

- 申请测试的企业用户数量已突破2万。

- 秒哒具备无代码编程和多智能体协作等核心特性。

- 详情链接: [digital.cloud.baidu.com](digital.cloud.baidu.com)

5. **谷歌推出Gemini2.0Flash-Lite**

- Gemini2.0Flash-Lite是成本效益最高的AI模型之一，输入tokens定价为每百万0.075美元，输出tokens为每百万0.30美元。

- 处理大规模文本输出任务表现出色，适合初创公司和小团队。

- 虽然不支持高级功能，但在文本生成领域高效实用。

6. **幻方量化回应DeepSeek-R2模型提前发布**

- 幻方量化强调一切以官方消息为准。

- DeepSeek于2023年7月成立深度求索AI公司，并于1月发布了DeepSeek-R1模型。

- 新一代DeepSeek-R2模型有望在代码生成和多语言推理能力上实现提升。

7. **微软开源多模态AI Agent“Magma”**

- Magma能够处理图像、视频和文本等多种数据类型，具备心理预测功能。

- 可帮助用户进行自动下单、查询天气等操作，并控制实体机器人。

- 增强了机器人的学习能力和实用性。

- 详情链接: [microsoft.github.io](microsoft.github.io)

8. **OpenAI扩展深度研究功能**

- OpenAI将深度研究功能扩展至多个用户层级，增强AI助手的研究能力。

- 中国DeepSeek通过开源新模型挑战OpenAI的订阅商业模式。

- 深度研究在效率与局限性之间创造了新的商业机会。

9. **PhotoDoodle AI将照片变成艺术作品**

- PhotoDoodle基于Flux.1模型，从少量样本中学习艺术风格并执行编辑指令。

- 位置编码克隆技术确保新元素自然融入背景。

- 研究团队已发布包含六种艺术风格的数据集。

- 详情链接: [github.com](github.com)

10. **OpenAI免费开放ChatGPT高级语音聊天模式**

- 高级语音模式基于GPT-4o mini模型，性能接近完整版GPT-4o。

- 支持macOS及Windows 10、11系统的ChatGPT桌面应用程序。

- 提供5种语音选择，支持自定义提示与对话内容回顾功能。

11. **AI特效“快来惹毛我”火爆出圈**

- 该特效可将现实建筑转化为可爱的毛绒玩偶风格。

- 在社交平台上迅速走红，吸引大量用户参与并分享生成的视频。

- 用户可通过筛选不同风格的生成图片，确保最终效果更符合个人喜好。

12. **OPPO ColorOS接入满血版DeepSeek-R1**

- 小布助手功能显著提升，支持一键AI唤醒、语音对话、联网搜索及结果导出。

- OPPO进行了本地化网络部署，显著提升系统流畅度，用户体验更佳。

- 展现了OPPO在技术创新方面的实力与决心。