腾讯混元开源0.5-7B小模型:手机电脑AI Agent新突破

腾讯混元开源0.5-7B小模型:手机电脑AI Agent新突破

14分钟 ·
播放数0
·
评论数0

腾讯混元团队最新开源了四款小尺寸语言模型(0.5B至7B),旨在支持消费级硬件上的低功耗运行和垂直领域微调。这些模型融合了快速推理能力、超长上下文窗口以及增强的Agent能力,已在多种内部业务场景中得到验证和应用,彰显了腾讯在中国AI开源浪潮中的积极布局。

全新开源小模型发布

  • 模型规模与数量:腾讯混元团队一口气开源了四款小语言模型,尺寸分别为0.5B、1.8B、4B和7B。
  • 运行环境与适用场景:这些模型可在消费级显卡上运行,适用于笔记本电脑、手机、智能座舱、智能家居等低功耗设备。
  • 部署与微调:支持垂直领域低成本微调,并已在GitHub和HuggingFace上线,获得ARM、高通、英特尔、联发科技等芯片平台的支持。

核心技术亮点与能力

  • 融合推理模式:模型具备推理速度快、性价比高的特点,提供“快思考”(简洁高效输出)和“慢思考”(复杂问题解决)两种模式。
  • Agent能力增强:通过精心的数据构建和强化学习,提升了模型在任务规划、工具调用、复杂决策和反思等方面的表现,可胜任深度搜索、电子表格操作等任务。
  • 超长上下文窗口:原生支持256k上下文,相当于处理40万中文汉字或50万英文单词,能够理解并记住超长内容的细节。
  • 卓越性能表现:在语言理解、数学、推理等领域表现出色,在多个公开测试集上得分达到领先水平,与业界同尺寸模型对标。

广泛部署与多元应用

  • 部署便捷性:所有模型均只需单卡即可部署,可直接接入PC、手机、平板等设备,并支持主流推理框架(如SGLang、vLLM、TensorRT-LLM)和多种量化格式。
  • 内部业务落地:已在腾讯会议AI小助手、微信读书AI问书、腾讯手机管家、腾讯智能座舱、搜狗输入法、腾讯地图、微信输入法等多个腾讯核心业务中得到应用和验证。
  • 具体应用案例:实现万字会议纪要精准理解、毫秒级垃圾短信拦截、提升嘈杂环境下的识别准确率、以及在金融和游戏等垂直领域的智能辅助。

腾讯的AI开源战略布局

  • 顺应AI开源浪潮:腾讯混元积极参与中国AI开源浪潮,响应“小语言模型是智能体AI的未来”的趋势。
  • 多模态开源覆盖:其开源模型已覆盖文本、图像、视频和3D生成等多个模态,例如此前已开源Hunyuan Large和Hunyuan-A13B。
  • 持续创新与贡献:近期发布并开源了混元3D世界模型1.0,迅速登上Hugging Face趋势榜和论文热榜,展示了其在技术创新和开源社区贡献方面的实力。