阿里腾讯双巨头开源AI新模型，全球7亿人用上ChatGPT！

阿里发布200亿参数图像生成大模型Qwen-Image

阿里通义千问团队在8月4日开源了其最新的图像生成模型——Qwen-Image，这是一个20B参数的MMDiT架构模型，专为下一代文生图任务设计，特别在生成带有原生文本的图形海报方面表现出色。

据项目介绍，Qwen-Image在文本渲染方面达到了业界领先水平，英文表现可与GPT-4o媲美，中文生成效果更是当前最佳。其最大亮点是实现像素级文本生成（In-pixel text generation），无需后期叠加，文字与图像自然融合，毫无违和感。

该模型支持中英文双语、多种字体（包括手写体）以及复杂多行排版，不仅能用于高质量海报、艺术创作，还可处理目标检测、语义分割、深度估计、新视角合成和超分辨率等多种图像理解任务，是一个真正的“全能型”视觉AI。

腾讯也在同一天宣布开源四款Hunyuan小模型，覆盖0.5B、1.8B、4B、7B四种参数规模，主打设备端轻量化部署，手机、平板、智能家居、车载系统均可运行。

这四款模型均原生支持256K长上下文，具备智能体（Agent）能力，能完成任务规划、工具调用和复杂决策。开发者可选择“快思考”模式进行快速推理，或“慢思考”模式进行深度分析，灵活适应不同场景。

模型已支持SGLang、vLLM、TensorRT-LLM等主流推理框架，单卡即可部署，极大降低了AI应用门槛。腾讯表示此举旨在构建更完整的开源大模型生态，推动垂直领域低成本微调。

OpenAI旗下ChatGPT用户增长势头惊人，最新数据显示其周活跃用户已接近7亿，较今年3月的5亿大幅增长40%，相比去年同期更是翻了两番。

面对庞大的用户基数，OpenAI近期宣布将加强心理健康安全机制。新功能包括：在长时间对话后提醒用户“是否需要休息一下？”，以避免过度依赖；同时优化模型对情绪困扰和妄想迹象的识别能力。

此外，在涉及高风险决策（如感情问题）时，ChatGPT将不再给出明确建议，而是引导用户分析利弊，帮助其自主思考，而非提供“答案”。

Cognitive Kernel-Pro：腾讯开源的多模块AI智能体框架，通过高质量数据构建和运行时优化策略，在GAIA等基准测试中实现开源Agent的SOTA表现。👉 GitHub

Price Per Token：一个实时对比主流AI模型价格的工具网站，支持按Prompt计算成本，帮助开发者和企业选择性价比最高的AI服务。👉 pricepertoken.com

从阿里、腾讯的密集开源，到OpenAI对AI伦理的持续投入，AI领域正加速走向开放、高效与负责任的发展路径。模型能力不断提升的同时，轻量化、实用性与安全性也被提上日程。未来，我们或将看到更多‘大模型能力，小模型运行’的创新应用落地于日常设备中。