【AI产品】
快手推出AI作图工具 Poify
* 专注于电商领域的图像处理
* 核心功能包括文生图、图生图、AI模特试衣、背景更换
* 旨在提高商家效率,降低成本
【AI模型】
字节跳动发布开源代码模型 Seed-Coder
* 8B参数,支持32K上下文
* 专注于代码生成和软件工程任务
* 在多个基准测试中表现出色
项目链接: github.com
【行业动态】
DeepSeek App 等入选2025年度十大IP
* 2025世界IP经济发展大会公布评选结果
* 展示中国文化创意的多样性
【AI产品】
Claude AI API 引入网页搜索功能
* 使其能够实时访问网络信息
* 提升回答准确性
* 应用于金融、法律、开发者工具等领域
【AI模型】
苹果发布 FastVLM 视觉语言模型
* 专为高分辨率图像处理优化,适合移动设备
* 采用FastViTHD编码器,编码速度提升85倍
* 模型已开源
项目链接: github.com
【AI框架】
腾讯与清华大学合作推出 AI 框架 PrimitiveAnything
* 用于3D形状的抽象与生成
* 支持从文本或图像输入生成3D内容
* 通过解码器生成可变长度的原始组件序列
项目链接: huggingface.co
【行业动态】
首个智能文档处理基准 IDP Leaderboard 发布
* 评估视觉-语言模型在文档处理任务上的表现
* Gemini 2.5 Flash 综合实力领先,但在OCR和分类任务上表现有待改进
详情链接: github.com
【AI模型】
谷歌 Gemini 2.5 Pro 实现6小时视频理解
* 支持长达6小时视频分析,200万Token上下文窗口
* 可通过API解析YouTube链接
* 在VideoMME基准测试中准确率达84.7%
【AI研究】
研究表明用户提问方式影响AI模型准确性
* 简洁请求可能导致语言模型准确性下降,抗幻想能力降低
* 用户语气和措辞(如自信)会影响模型纠正能力
* 小模型更易受影响
【AI产品】
全球首款 AI 智能浏览器 Fellou 发布
* 具备AI智能自动化功能
* 支持深度研究模式和深度工作流模式
* 承诺本地处理数据,保障用户隐私
详情链接: fellou.ai
【AI技术】
NVIDIA 推出 Audio-SDS 技术
* 将 Score Distillation Sampling 扩展至音频领域
* 提升音效生成和音源分离能力
* 支持通过文本提示生成定制化音效
* 技术已开源
详情链接: research.nvidia.com
【行业动态】
Kimi 智能助手入驻小红书
* 标志着AI大模型在内容平台的新尝试
* 用户可在小红书与Kimi对话并一键生成笔记
* 显示Kimi策略从买量驱动转向内容与社区