深度探索者-R1问世!挑战 OpenAI o1,引领下一代人工智能浪潮-大浪资讯

admin92025-01-20 21:44:45

深度探索者-R1问世!挑战 OpenAI o1,引领下一代人工智能浪潮

开创未来智能时代,探索无限可能

   1月20日更新,幻方量化旗下的AI企业深度求索(DeepSeek)今日正式推出DeepSeek-R1模型,并同时开放了模型权重的源代码。

   据官方介绍,DeepSeek-R1在后训练阶段广泛采用了强化学习技术,即使在标注数据极为有限的情况下,也显著提升了模型的推理能力。在数学、编程、自然语言推理等任务上,其表现与OpenAI的正式版本相当。

   DeepSeek 称,DeepSeek-R1 蒸馏小模型超越 OpenAI o1-mini。DeepSeek 在开源 DeepSeek-R1-Zero 和 DeepSeek-R1 两个 660B 模型的同时,通过 DeepSeek-R1 的输出,蒸馏了 6 个小模型开源给社区,其中 32B 和 70B 模型在多项能力上实现了对标 OpenAI o1-mini 的效果。

   访问DeepSeek官方网站或官方应用程序,启动“深度探索”模式,就可以使用最新版本的DeepSeek-R1来完成各种推理任务。

   DeepSeek-R1API的服务定价为每百万输入token 1元(当缓存命中时)或4元(当缓存未命中时),而每百万输出token的费用为16元。

   注意到,DeepSeek已经将其研发的DeepSeek-R1训练技术完全公开,并且在发布和开源R1的同时,也在协议授权方面做出了相应的调整。 这样的举措无疑为人工智能领域的发展注入了新的活力。一方面,它极大地促进了技术的传播与共享,让更多研究者能够接触并利用这项技术进行创新和改进。另一方面,协议授权层面的调整也有助于平衡开放源代码带来的利益分配问题,确保各方权益得到合理保障。总体而言,DeepSeek此举展现了其作为行业领先者的责任感和前瞻性,对于推动整个行业的进步具有重要意义。

   我们决定将模型的开源许可证统一更改为MIT许可证。鉴于大模型开源的独特性,我们曾借鉴行业惯例,引入了DeepSeek许可证以更好地服务于开源社区。然而,实际操作表明,非标准的开源许可证可能会增加开发者的理解难度。因此,我们这次将整个开源仓库(包括模型权重)改用更为标准化且宽松的MIT许可证,实现完全开源,并允许无限制地商用,无需额外申请。

   我们已经对线上产品的用户协议进行了更新,明确指出用户可以利用模型输出并通过模型蒸馏等方式来训练其他模型。这一举措旨在进一步推动技术的开源与共享,使更多人能够从中受益。我们相信,此举不仅有助于加速技术创新和进步,还能激发更多的合作与交流。同时,这也体现了我们对开放科学和知识共享理念的支持。希望这样的措施能鼓励更多用户参与到技术开发的过程中,共同推动行业向前发展。