深度探索!Gitee AI 联合沐曦推出全新免费千问蒸馏模型 DeepSeek R1,抢先体验!-大浪资讯

admin82025-02-03 16:48:58

深度探索!Gitee AI 联合沐曦推出全新免费千问蒸馏模型 DeepSeek R1,抢先体验!

AI大爆发!全新免费千问蒸馏模型震撼来袭!

   2月3日消息,GiteeAI昨日宣布推出DeepSeek-R1-Distill-Qwen-1.5B、DeepSeek-R1-Distill-Qwen-7B、DeepSeek-R1-Distill-Qwen-14B和DeepSeek-R1-Distill-Qwen-32B这四个规模较小的DeepSeek系列模型。特别值得注意的是,这些新模型均运行于国内自主研发的沐曦曦云GPU平台上。

   相较于全尺寸的DeepSeek模型,小型化的DeepSeek蒸馏版本更适用于企业内部部署,有助于减少实施成本。

   同时,此次DeepseekR1模型在沐曦曦云GPUGiteeAI平台上进行研发,成功实现了从芯片到平台,从算力到模型的全国产化开发。

   注:DeepSeekR1是一款大规模混合专家(MoE)模型,包含6710亿个参数,能够处理长达128000个Token的巨大输入上下文。

   本次部署在沐曦曦云GPU上的是四个DeepSeekR1蒸馏模型,据说以更小的参数量实现了与大参数模型相媲美的性能。 这种技术突破不仅展示了深度学习领域的一种新趋势,即通过优化算法和模型架构来提高效率,同时也为未来的AI应用提供了更多的可能性。随着计算资源成本的不断上升,这种能够以较少资源实现高效能的技术显得尤为重要。它不仅有助于降低企业和研究机构的成本,还可能推动更多创新性项目的诞生。

   目前 Gitee AI 上的 DeepSeek-R1-Distill 系列模型现已面向全体开发者免费使用。