【AI日报】EP.104 2月27 阿里开源文生视频模型万相2.1;幻方量化回应DeepSeek-R2模型提前发布Aishaobing的个人播客

【AI日报】EP.104 2月27 阿里开源文生视频模型万相2.1;幻方量化回应DeepSeek-R2模型提前发布

5分钟 ·
播放数145
·
评论数0

### AI日报新闻提要

1. **阿里开源文生视频模型万相2.1**

   - Wan2.1模型在Vbench评测中以86.22%的成绩领先其他视频生成模型。

   - 采用3D因果VAE模块,实现256倍无损视频隐空间压缩。

   - 支持多种主流框架,开发者可通过Gradio快速体验。

   - 详情链接: [github.com](github.com)

2. **360智脑发布Tiny-R1-32B**

   - 该模型仅用5%的参数量接近Deepseek-R1的性能。

   - 在数学、编程和科学领域表现优异,AIME2024评测中取得78.1分。

   - 研发团队承诺公开完整模型仓库,并已上传至Hugging Face平台。

   - 详情链接: [huggingface.co](huggingface.co)

3. **DeepSeek发布DeepGEMM库**

   - DeepGEMM支持FP8通用矩阵乘法,适用于密集型和混合专家模型。

   - 在NVIDIA Hopper GPU上实现超过1350TFLOPS的FP8计算性能。

   - 核心代码仅300行,展现极高效率与简洁性。

   - 详情链接: [github.com](github.com)

4. **百度“秒哒”开启用户邀测**

   - 用户可通过邀测邮件访问秒哒,体验H5页面开发和网站开发等功能。

   - 申请测试的企业用户数量已突破2万。

   - 秒哒具备无代码编程和多智能体协作等核心特性。

   - 详情链接: [digital.cloud.baidu.com](digital.cloud.baidu.com)

5. **谷歌推出Gemini2.0Flash-Lite**

   - Gemini2.0Flash-Lite是成本效益最高的AI模型之一,输入tokens定价为每百万0.075美元,输出tokens为每百万0.30美元。

   - 处理大规模文本输出任务表现出色,适合初创公司和小团队。

   - 虽然不支持高级功能,但在文本生成领域高效实用。

6. **幻方量化回应DeepSeek-R2模型提前发布**

   - 幻方量化强调一切以官方消息为准。

   - DeepSeek于2023年7月成立深度求索AI公司,并于1月发布了DeepSeek-R1模型。

   - 新一代DeepSeek-R2模型有望在代码生成和多语言推理能力上实现提升。

7. **微软开源多模态AI Agent“Magma”**

   - Magma能够处理图像、视频和文本等多种数据类型,具备心理预测功能。

   - 可帮助用户进行自动下单、查询天气等操作,并控制实体机器人。

   - 增强了机器人的学习能力和实用性。

   - 详情链接: [microsoft.github.io](microsoft.github.io)

8. **OpenAI扩展深度研究功能**

   - OpenAI将深度研究功能扩展至多个用户层级,增强AI助手的研究能力。

   - 中国DeepSeek通过开源新模型挑战OpenAI的订阅商业模式。

   - 深度研究在效率与局限性之间创造了新的商业机会。

9. **PhotoDoodle AI将照片变成艺术作品**

   - PhotoDoodle基于Flux.1模型,从少量样本中学习艺术风格并执行编辑指令。

   - 位置编码克隆技术确保新元素自然融入背景。

   - 研究团队已发布包含六种艺术风格的数据集。

   - 详情链接: [github.com](github.com)

10. **OpenAI免费开放ChatGPT高级语音聊天模式**

    - 高级语音模式基于GPT-4o mini模型,性能接近完整版GPT-4o。

    - 支持macOS及Windows 10、11系统的ChatGPT桌面应用程序。

    - 提供5种语音选择,支持自定义提示与对话内容回顾功能。

11. **AI特效“快来惹毛我”火爆出圈**

    - 该特效可将现实建筑转化为可爱的毛绒玩偶风格。

    - 在社交平台上迅速走红,吸引大量用户参与并分享生成的视频。

    - 用户可通过筛选不同风格的生成图片,确保最终效果更符合个人喜好。

12. **OPPO ColorOS接入满血版DeepSeek-R1**

    - 小布助手功能显著提升,支持一键AI唤醒、语音对话、联网搜索及结果导出。

    - OPPO进行了本地化网络部署,显著提升系统流畅度,用户体验更佳。

    - 展现了OPPO在技术创新方面的实力与决心。