阿里巴巴(09988)正式推出其迄今为止规模最大、能力最强的模型 Qwen3-Max

  • 新浪网
  • 2025-09-24 12:28:07


(资料图片仅供参考)

智通财经获悉,据通义千问Qwen公众号消息,继 Qwen3-2507 系列发布之后,阿里云通义千问推出其迄今为止规模最大、能力最强的模型—— Qwen3-Max。

目前,Qwen3-Max-Instruct 的预览版在 LMArena 文本排行榜上位列第三,超越了 GPT-5-Chat。正式版本在代码能力和智能体(agent)能力方面进一步提升,在涵盖知识、推理、编程、指令遵循、人类偏好对齐、智能体任务和多语言理解的全面基准测试中均达到业界领先水平。

通义团队表示,Qwen3-Max模型总参数超过1T,预训练使用了36T tokens。模型结构沿用了Qwen3系列的模型结构设计范式,使用了通义提出的global-batch load balancing loss。

此外,Qwen3-Max 的推理增强版本—— Qwen3-Max-Thinking已展现出非凡潜力。通过集成代码解释器并运用并行测试时计算技术,该“思考”版本已在 AIME 25、HMMT 等高难度推理基准测试中取得 100% 的准确率。

责任编辑:栎树

关键词: 财经要闻 实时要闻

分享到:

  • 至少输入5个字符
  • 表情

热门资讯