【AI日报】EP.147 5月13 DeepSeek入选2025年度十大IP;快手推出AI作图工具 PoifyAishaobing的个人播客

【AI日报】EP.147 5月13 DeepSeek入选2025年度十大IP;快手推出AI作图工具 Poify

12分钟 ·
播放数136
·
评论数0

【AI产品】

快手推出AI作图工具 Poify

*   专注于电商领域的图像处理

*   核心功能包括文生图、图生图、AI模特试衣、背景更换

*   旨在提高商家效率,降低成本

【AI模型】

字节跳动发布开源代码模型 Seed-Coder

*   8B参数,支持32K上下文

*   专注于代码生成和软件工程任务

*   在多个基准测试中表现出色

项目链接: github.com

【行业动态】

DeepSeek App 等入选2025年度十大IP

*   2025世界IP经济发展大会公布评选结果

*   展示中国文化创意的多样性

【AI产品】

Claude AI API 引入网页搜索功能

*   使其能够实时访问网络信息

*   提升回答准确性

*   应用于金融、法律、开发者工具等领域

【AI模型】

苹果发布 FastVLM 视觉语言模型

*   专为高分辨率图像处理优化,适合移动设备

*   采用FastViTHD编码器,编码速度提升85倍

*   模型已开源

项目链接: github.com

【AI框架】

腾讯与清华大学合作推出 AI 框架 PrimitiveAnything

*   用于3D形状的抽象与生成

*   支持从文本或图像输入生成3D内容

*   通过解码器生成可变长度的原始组件序列

项目链接: huggingface.co

【行业动态】

首个智能文档处理基准 IDP Leaderboard 发布

*   评估视觉-语言模型在文档处理任务上的表现

*   Gemini 2.5 Flash 综合实力领先,但在OCR和分类任务上表现有待改进

详情链接: github.com

【AI模型】

谷歌 Gemini 2.5 Pro 实现6小时视频理解

*   支持长达6小时视频分析,200万Token上下文窗口

*   可通过API解析YouTube链接

*   在VideoMME基准测试中准确率达84.7%

【AI研究】

研究表明用户提问方式影响AI模型准确性

*   简洁请求可能导致语言模型准确性下降,抗幻想能力降低

*   用户语气和措辞(如自信)会影响模型纠正能力

*   小模型更易受影响

【AI产品】

全球首款 AI 智能浏览器 Fellou 发布

*   具备AI智能自动化功能

*   支持深度研究模式和深度工作流模式

*   承诺本地处理数据,保障用户隐私

详情链接: fellou.ai

【AI技术】

NVIDIA 推出 Audio-SDS 技术

*   将 Score Distillation Sampling 扩展至音频领域

*   提升音效生成和音源分离能力

*   支持通过文本提示生成定制化音效

*   技术已开源

详情链接: research.nvidia.com

【行业动态】

Kimi 智能助手入驻小红书

*   标志着AI大模型在内容平台的新尝试

*   用户可在小红书与Kimi对话并一键生成笔记

*   显示Kimi策略从买量驱动转向内容与社区