全球首曝：QwQ-32B版本一键本地部署，单3090显卡即可流畅运行，共享算力成为技术新焦点

admin812025-03-10 14:54:32

机器之心独家发布：个人设备步入最强模型新时代

编者按

在人工智能领域，我们正见证一场前所未有的变革。近日，阿里开源了一款新一代推理模型，标志着个人设备进入最强模型时代。

人工智能的飞跃：阿里开源320亿参数模型

仅一天时间，阿里便推出了参数量高达320亿的全新推理模型QwQ-32B。这款模型不仅在性能上足以与DeepSeek-R1满血版相媲美，而且在数学推理、代码生成及通用任务处理能力上实现了显著突破，充分展现了强化学习在预训练基础模型中的应用潜力。

模型对比：QwQ-32B的性能表现

为了展示QwQ-32B的强大实力，我们将其与原始DeepSeek-R1、DeepSeek-R1-Distilled-Qwen-32B、DeepSeek-R1-Distilled-Llama-70B以及o1-mini进行了基准测试。结果显示，QwQ-32B在多项指标上均实现了显著提升，彰显了其在人工智能领域的领先地位。

技术普及：从“高高在上”到“触手可及”

尽管高性能大模型的技术进步令人欣喜，但部署门槛一直较高，阻碍了个人用户体验前沿技术。然而，随着“算了么”平台的推出，这一问题得到了有效解决。

平台创新：算力普惠，一键部署

“算了么”平台利用闲时GPU算力资源，为用户提供了便捷的AI推理服务。该平台最新推出的QwQ-32B一键部署方案，使得普通人也能轻松体验强大的推理能力。

实测数据：3090显卡轻松驾驭

在消费级RTX 3090显卡上，QwQ-32B的推理速度可达30-40tokens/秒，流畅高效，完全满足日常使用场景。

共享算力：开启个人算力共享新纪元

“算了么”平台不仅提供了一键部署服务，更致力于构建开源、普惠、共赢的算力生态。通过共享个人设备的闲时算力，用户不仅能够获取收益，还能推动AI技术的发展。

团队介绍：专业背景，创新驱动

“算了么”团队由清华大学、北京大学以及Intel、字节跳动等知名企业的核心成员组成，拥有深厚的学术和技术背景。团队在分布式资源调度领域深耕多年，曾获多项荣誉和投资。

未来展望：共同开启个人算力共享新篇章

随着单卡跑最强模型的时代已经到来，“算了么”平台期待与广大开发者、AI爱好者携手，共同开启个人算力共享的新篇章！

更多信息

免费API获取：qwq.aigpu.cn
免费试用Chatbot：aigpu.cn
平台官网：suanleme.cn

关注我们，获取更多AI技术资讯！

显卡算力 qwq 分布式计算高吞吐量内核"/>

随机文章

侧栏广告位