腾讯混元开源0.5-7B小模型：手机电脑AI Agent新突破

康乐的AI万事屋

14分钟 ·9个月前

0

·

0

腾讯混元团队最新开源了四款小尺寸语言模型（0.5B至7B），旨在支持消费级硬件上的低功耗运行和垂直领域微调。这些模型融合了快速推理能力、超长上下文窗口以及增强的Agent能力，已在多种内部业务场景中得到验证和应用，彰显了腾讯在中国AI开源浪潮中的积极布局。

全新开源小模型发布

模型规模与数量：腾讯混元团队一口气开源了四款小语言模型，尺寸分别为0.5B、1.8B、4B和7B。

运行环境与适用场景：这些模型可在消费级显卡上运行，适用于笔记本电脑、手机、智能座舱、智能家居等低功耗设备。

部署与微调：支持垂直领域低成本微调，并已在GitHub和HuggingFace上线，获得ARM、高通、英特尔、联发科技等芯片平台的支持。

核心技术亮点与能力

融合推理模式：模型具备推理速度快、性价比高的特点，提供“快思考”（简洁高效输出）和“慢思考”（复杂问题解决）两种模式。

Agent能力增强：通过精心的数据构建和强化学习，提升了模型在任务规划、工具调用、复杂决策和反思等方面的表现，可胜任深度搜索、电子表格操作等任务。

超长上下文窗口：原生支持256k上下文，相当于处理40万中文汉字或50万英文单词，能够理解并记住超长内容的细节。

卓越性能表现：在语言理解、数学、推理等领域表现出色，在多个公开测试集上得分达到领先水平，与业界同尺寸模型对标。

广泛部署与多元应用

部署便捷性：所有模型均只需单卡即可部署，可直接接入PC、手机、平板等设备，并支持主流推理框架（如SGLang、vLLM、TensorRT-LLM）和多种量化格式。

内部业务落地：已在腾讯会议AI小助手、微信读书AI问书、腾讯手机管家、腾讯智能座舱、搜狗输入法、腾讯地图、微信输入法等多个腾讯核心业务中得到应用和验证。

具体应用案例：实现万字会议纪要精准理解、毫秒级垃圾短信拦截、提升嘈杂环境下的识别准确率、以及在金融和游戏等垂直领域的智能辅助。

腾讯的AI开源战略布局

顺应AI开源浪潮：腾讯混元积极参与中国AI开源浪潮，响应“小语言模型是智能体AI的未来”的趋势。

多模态开源覆盖：其开源模型已覆盖文本、图像、视频和3D生成等多个模态，例如此前已开源Hunyuan Large和Hunyuan-A13B。

持续创新与贡献：近期发布并开源了混元3D世界模型1.0，迅速登上Hugging Face趋势榜和论文热榜，展示了其在技术创新和开源社区贡献方面的实力。

在小宇宙打开