仅需2小时响应:摩尔线程GPU迅速适配阿里通义千问QwQ-32B开源模型

admin82025-03-06 21:23:30

【快科技报道】

3月6日,一大早,业界便传来了重磅消息:阿里云正式对外发布并开源了其全新推理模型——“通义千问QwQ-32B”。令人惊喜的是,仅仅两个小时后,摩尔线程便迅速响应,高效完成了适配工作,实现了对这一模型的Day0级支持!

这款基于大语言模型高速推理框架vLLM和MT Transformer推理引擎部署的QwQ-32B,在摩尔线程GPU的实际运行中,展现出了令人瞩目的推理性能和稳定性。这一成就再次证明了摩尔线程MUSA架构强大的生态兼容性。

值得一提的是,在推出QwQ-32B之前,摩尔线程仅用短短一周时间,便迅速为DeepSeek开源周的“全家桶”提供了支持。

如今,摩尔线程已经将这一创新成果上线至模型广场“夸娥工场”。作为摩尔线程精心打造的模型展示中心,“夸娥工场”为用户提供了一个基于摩尔线程夸娥(KUAE)智算集群支持的模型能力体验平台。

以下是“夸娥工场”的体验地址: - 夸娥工场体验地址点击访问

而QwQ-32B模型的体验地址为: - QwQ-32B体验地址点击访问

接下来,让我们一睹“夸娥工场”的体验界面风采:

摩尔线程模型广场“夸娥工场”体验界面

在一系列权威基准测试中,千问QwQ-32B模型的表现令人印象深刻,几乎完全超越了OpenAI-o1-mini,与最强大的开源推理模型DeepSeek-R1并驾齐驱。

尽管QwQ-32B的参数仅为32B,但通过大规模强化学习训练,它在数学、编程、通用能力等多个领域实现了显著突破,展现了其卓越的智能化水平。

从官方发布的benchmark测试对比图中可以清晰地看到,QwQ-32B在各项测试中的成绩显著高于OpenAI-o1-mini、Deepseek的各个蒸馏版本。在LiveBench、BFCL测试中,它甚至击败了参数量更大的Deepseek-R1-671B。

这一系列成就无疑彰显了摩尔线程在人工智能领域的强大实力和创新能力。