: DeepSeek 推出 V3 版本模型升级:编程技能显著增强,同时开放更灵活的源代码许可政策

admin82025-03-25 12:31:22

标题:DeepSeek V3模型更新发布:性能提升显著,开源许可更宽松

来源:极客公园(ID:geekpark)
作者:张勇毅

一、新版本更新,开源社区迎来新成员

正如上周众多朋友所期待的那样,3月24日北京时间新的一周伊始,DeepSeek团队如期推出了模型更新。不过,这次更新并非DeepSeek V4或R2,而是V3模型的一次迭代升级。目前,该开源版本已成功上架开源网站,模型体积高达6850亿参数。

二、小版本升级,体验全面优化

DeepSeek官方微信公众号确认,本次更新属于小版本升级,现已在官方网页、App小程序等多个入口开放。初代V3模型以其“557.6万美金比肩Claude 3.5效果”的超级性价比而备受关注。此次更新得益于新的32KGPU集群,后训练技术的改进,使得模型性能得到进一步提升。

三、编码能力显著提升,体验堪比专家级程序员

截至目前,新版DeepSeek V3的能力基准测试榜单尚未出现,但凭借DeepSeek V3在发布后一小时便成为Chatbot Arena榜单前十中唯一一个开源模型的辉煌历史,全球用户对其测试体验的热情可见一斑。根据最新用户上手测试,新版V3模型在前端编码能力上的提升尤为显著,其提升幅度堪比Sonnet 3.5到Sonnet 3.6的升级。

四、对比R1与Claude系列,新版V3表现亮眼

用户通过对比提示词,将新版V3与R1以及Claude系列进行了比较。作为目前号称“编程能力最强模型”的Claude 3.7,其编程能力使用体验多次被评为“已达到专家级程序员水准”。在相同提示词的输入下,新版V3生成的前端内容与Claude 3.7相比,展现出令人惊喜的进步。

五、多轮对话能力增强,R2模型发布指日可待

除了编程能力,新版V3在多轮对话中也展现出了更强的上下文理解能力。尽管DeepSeek并未透露R2或V4模型的发布时间,但许多用户在体验新版V3后,都认为R2的发布已经近在咫尺。

六、开源许可更新,使用条件更宽松

值得一提的是,新版V3的开源许可与R1一样,已更新为MIT开源许可。这意味着新版V3拥有比初代V3更宽松的开源使用条件,对于希望在商业项目中使用新版V3模型的开发者来说,无疑是一个重大利好。

七、MIT许可助力商业集成,开发者迎来新机遇

MIT开源许可以其商业友好而著称,使用MIT许可的项目可以与商业和专有软件集成。这次更新对于希望在商业项目中使用新版V3模型的开发者来说,无疑是一个重要的改变。

结语:

DeepSeek V3模型的更新,无疑为开源社区带来了新的活力。随着新版V3的推出,我们期待DeepSeek在未来能够带来更多令人惊喜的技术突破。

(本文为极客公园原创文章,转载请联系极客君微信geekparkGO。点个“爱心”,再走吧!