【AI日报】EP.147 5月13 DeepSeek入选2025年度十大IP；快手推出AI作图工具 Poify

Aishaobing的个人播客

12分钟 ·1 年前

145

·

0

【AI产品】

快手推出AI作图工具 Poify

* 专注于电商领域的图像处理

* 核心功能包括文生图、图生图、AI模特试衣、背景更换

* 旨在提高商家效率，降低成本

【AI模型】

字节跳动发布开源代码模型 Seed-Coder

* 8B参数，支持32K上下文

* 专注于代码生成和软件工程任务

* 在多个基准测试中表现出色

项目链接: github.com

【行业动态】

DeepSeek App 等入选2025年度十大IP

* 2025世界IP经济发展大会公布评选结果

* 展示中国文化创意的多样性

【AI产品】

Claude AI API 引入网页搜索功能

* 使其能够实时访问网络信息

* 提升回答准确性

* 应用于金融、法律、开发者工具等领域

【AI模型】

苹果发布 FastVLM 视觉语言模型

* 专为高分辨率图像处理优化，适合移动设备

* 采用FastViTHD编码器，编码速度提升85倍

* 模型已开源

项目链接: github.com

【AI框架】

腾讯与清华大学合作推出 AI 框架 PrimitiveAnything

* 用于3D形状的抽象与生成

* 支持从文本或图像输入生成3D内容

* 通过解码器生成可变长度的原始组件序列

项目链接: huggingface.co

【行业动态】

首个智能文档处理基准 IDP Leaderboard 发布

* 评估视觉-语言模型在文档处理任务上的表现

* Gemini 2.5 Flash 综合实力领先，但在OCR和分类任务上表现有待改进

详情链接: github.com

【AI模型】

谷歌 Gemini 2.5 Pro 实现6小时视频理解

* 支持长达6小时视频分析，200万Token上下文窗口

* 可通过API解析YouTube链接

* 在VideoMME基准测试中准确率达84.7%

【AI研究】

研究表明用户提问方式影响AI模型准确性

* 简洁请求可能导致语言模型准确性下降，抗幻想能力降低

* 用户语气和措辞（如自信）会影响模型纠正能力

* 小模型更易受影响

【AI产品】

全球首款 AI 智能浏览器 Fellou 发布

* 具备AI智能自动化功能

* 支持深度研究模式和深度工作流模式

* 承诺本地处理数据，保障用户隐私

详情链接: fellou.ai

【AI技术】

NVIDIA 推出 Audio-SDS 技术

* 将 Score Distillation Sampling 扩展至音频领域

* 提升音效生成和音源分离能力

* 支持通过文本提示生成定制化音效

* 技术已开源

详情链接: research.nvidia.com

【行业动态】

Kimi 智能助手入驻小红书

* 标志着AI大模型在内容平台的新尝试

* 用户可在小红书与Kimi对话并一键生成笔记

* 显示Kimi策略从买量驱动转向内容与社区

在小宇宙打开