业界热议DeepSeek悄然推出新功能

admin242025-03-26 16:15:01

深度求索AI新品发布:DeepSeek-V3-0324版震撼登场

来源:环球时报

【环球时报报道】 在人工智能领域,中国初创公司深度求索(DeepSeek)再次引发行业关注。24日深夜,该公司悄无声息地发布了DeepSeek-V3的新版本——DeepSeek-V3-0324,参数量高达6850亿,其代码、数学、推理等多方面的能力均得到了显著提升,甚至在代码能力上与美国Anthropic公司的Claude 3.7大模型不相上下。然而,外界对这一版本的期待,并不仅仅停留在其能力上,更多人猜测这可能是DeepSeek即将发布的V4和R2大模型的先兆。

DeepSeek移动端页面

能力全面升级,技术实力备受瞩目

在《环球时报》记者的提问下,DeepSeek团队透露了新版本的能力提升。首先是代码能力的大幅提升,新版本能够一次性生成高达800行无错误的网页代码,并实现动态响应式布局和交互效果。其次,数学与逻辑推理能力也得到了显著增强,在处理“4升水壶问题”和AIME 2025竞赛题等经典问题上的表现,部分已接近专业推理模型。此外,V3-0324还采用了MIT许可证,允许自由修改、分发及商业化应用,进一步降低了开发者的使用门槛。

清华大学教授沈阳:DeepSeek-V3-0324是中国AI技术崛起的又一里程碑

清华大学新闻学院和人工智能学院教授沈阳在25日对《环球时报》记者表示,DeepSeek-V3-0324的发布不仅是V3系列的一次迭代,更是中国AI技术崛起的显著标志。其在性能、效率和开源策略上的优势,使其在全球大语言模型领域占据了重要位置。沈阳教授预测,DeepSeek未来可能通过提升推理能力和多模态扩展,巩固其在技术领域的领先地位,并在中美竞争和社区生态中寻求平衡。

外媒传言DeepSeek即将推出R2大模型

路透社在2月底引用三位知情人士的话称,DeepSeek原计划在今年5月初发布R2大模型,但现在已经决定提前推出,具体时间尚未公布。据悉,DeepSeek希望新模型在代码生成和多语言推理方面能有更出色的表现。尽管外媒的传言尚未得到DeepSeek公司的官方证实,但这一消息无疑引起了业界的广泛关注。

沈阳教授:DeepSeek-V3-0324的推出凸显中国AI企业竞争力

沈阳教授指出,DeepSeek-V3-0324的发布进一步凸显了中国AI企业在技术和成本上的竞争力。美国对华GPU出口限制可能促使中国企业加速国产硬件适配,而DeepSeek的开源模式也可能引发西方厂商的连锁反应,例如推出更强闭源模型。他认为,2025年可能成为中美AI竞争的关键分水岭。

未来趋势:大模型融合通用与推理能力

沈阳教授还提到,在OpenAI公司的GPT大模型试图将通用大模型和推理大模型融合的背景下,外界开始关注包括DeepSeek在内的中国头部大模型是否也会出现类似的合并趋势。沈阳教授表示,这种可能性是存在的,因为用户更关心的是大模型能否提供智能合理的参考答案,而不关心其内部使用的是何种类型的模型。


注:文中图片及数据仅为示例,请以实际内容为准。