【AI日报】EP.85 1月22 赶超o1!国产大模型DeepSeek R1开源;Kimi多模态思考模型k1.5登场;Aishaobing的个人播客

【AI日报】EP.85 1月22 赶超o1!国产大模型DeepSeek R1开源;Kimi多模态思考模型k1.5登场;

8分钟 ·
播放数193
·
评论数0

【AI模型】DeepSeek R1开源,性能直逼OpenAI

DeepSeek发布大型语言模型R1,性能媲美OpenAI的o1,特别在数学、代码和自然语言推理方面表现优异。

开源了660B参数的DeepSeek-R1和DeepSeek-R1-Zero模型,以及6个小模型。

API定价具竞争力,缓存命中每百万输入tokens仅需1元。

参考链接: [github.com](github.com)

**【多模态】月之暗面发布k1.5多模态思考模型**

*   k1.5具备卓越的多模态处理能力,可同时处理文本、图像和声音信息。

*   强大的通用推理能力使其适用于编程、数学等多种任务。

*   k1.5模型预览版已在Kimi.com和Kimi智能助手App上线。

项目链接:[Kimi.com](kimi.com)  和 Kimi智能助手App

**【AI视频】智谱推出AI生视频产品清影2.0**

*   清影2.0模型能力和视频生成质量显著提升,可生成自然流畅的动作和精美画面。

*   支持多种艺术风格的视频生成。

*   基础模型能力提升38%,用户通过简单提示词即可实现复杂场景。

参考链接: [chatglm.cn](chatglm.cn)

**【语音交互】豆包App推出新语音模式,抢先GPT-4o实现唱歌和角色扮演**

*   “端到端”语音大模型更新实时语音通话功能,整合语音识别、理解和生成能力。

*   新增“灵魂歌手”、“百变大咖”、“受气小包”和“夸夸大师”等人格模式,增强互动趣味性。

**【AI工具】OpenAI即将推出能控制电脑的AI工具“Operator”**

*   “Operator”可自主控制个人电脑,执行编写代码和预定旅行等多项任务。

*   预计2025年1月发布,专家对其潜在安全隐患表示担忧。

**【AI应用】美图WHEE「AI海报」功能即将上线**

*   用户只需输入一句话,即可生成多种风格的海报,特别支持中文字体。

*   提供强大的自定义排版能力,涵盖多个核心场景。

**【AI应用】百度文库AI功能月活用户突破9000万,付费用户超4000万**

*   月活用户同比增长230%,新增100多项AI功能,包括智能PPT和全网搜。

*   “自由画布”功能开启公测,支持多任务并行处理。

**【AI历史】世界首个聊天机器人ELIZA复活,源自60年前的代码**

*   美英研究团队成功复活ELIZA代码,代码由约瑟夫·韦岑鲍姆在1960年代编写。

*   ELIZA在计算机历史上具有重要意义,被认为是聊天机器人的开创者。

**【长视频处理】中国科研团队发布VideoChat-Flash,长视频处理速度提升100倍**

*   VideoChat-Flash系统利用层次化视频标记压缩技术HiCo,显著提升长视频处理效率。

*   采用多阶段学习方法,结合短视频和长视频进行训练。

*   在多个基准测试中表现优异。

参考链接: [arxiv.org](arxiv.org)

**【数据抓取】Firecrawl Extract无需编写代码,轻松抓取任何网站的数据**

*   Firecrawl Extract通过自然语言处理技术,允许用户仅通过文字提示提取网站数据。

*   支持多语言和国际网站的数据抓取,能够处理JavaScript渲染的动态页面内容。

*   提供API接口,便于与其他应用集成。

参考链接: [github.com](github.com)

**【市场预测】2024年出货的笔记本电脑中,超25%具备生成式AI功能**

*   2024年全球PC市场预计增长2.6%,出货量达到2.53亿台。

*   超过25%的新笔记本电脑将具备生成式AI功能。

*   2025年预计AI笔记本电脑将占据市场近60%的份额。