139位中国清北名校天才联手创业,引领硅谷新风向-大浪资讯

admin82025-01-12 14:53:36

139位中国清北名校天才联手创业,引领硅谷新风向

北清科班精英齐聚硅谷,领航创新风潮

   1月12日消息,据媒体报道,DeepSeek作为年初AI领域的一大亮点,以“国产骄傲”的新面貌震惊了国内外科技界。这家AI初创公司凭借其独特的团队组合和杰出的技术成果,迅速成为行业瞩目的焦点。

139位中国清北名校天才联手创业,引领硅谷新风向

   DeepSeek的团队虽然只有139名工程师和研究人员,但其创始人梁文锋带领的团队实力不容小觑。与拥有1200名研究人员的OpenAI和500多名研究人员的Anthropic相比,DeepSeek的人数显得微不足道。然而,这并不意味着他们的工作就逊色于那些大团队。事实上,许多成功的科技创新并非单纯依赖于庞大的团队规模,而更多地取决于团队的核心技术和创新能力。 这样的团队结构不仅显示了DeepSeek在资源利用上的高效性,也证明了在人工智能领域,精干的小团队同样能够取得令人瞩目的成就。

139位中国清北名校天才联手创业,引领硅谷新风向

   然而,DeepSeek凭借其独特的宣传标签,例如“从未接受过外部投资”、“创始人拥有大量股份”、“团队成员均毕业于清华、北大等顶尖学府”等,在人工智能创业领域迅速脱颖而出。 这些标签不仅突显了DeepSeek的独立性和创始人的远见卓识,同时也彰显了团队成员的卓越背景。这种组合无疑为公司赢得了更多的关注与信任,使其在竞争激烈的AI市场中占据了一席之地。不过,值得注意的是,这样的宣传策略能否长期维持公司的竞争优势还有待观察。毕竟,除了优秀的团队背景和创始人的资本实力外,技术创新和市场需求也是决定企业长远发展的关键因素。

   2024年12月,DeepSeek发布了最新的V3开源模型,在评测中表现出色,不仅超越了阿里自研的Qwen2.5-72B和Meta自研的Llama3.1-405B等顶级开源模型,甚至能够与GPT-4o、Claude3.5-Sonnet等顶级闭源模型相媲美。 这一消息无疑令人振奋。DeepSeek的V3开源模型在多个维度上取得了突破性的进展,其卓越的表现不仅标志着开源领域的一个重要里程碑,也意味着人工智能技术正在以前所未有的速度发展。这不仅提升了我们对开源模型潜力的信心,也为未来的人工智能研究和应用开辟了新的道路。同时,这也反映了开源社区在推动技术创新方面的重要作用。随着更多优秀开源模型的涌现,我们可以期待人工智能技术将在更广泛的领域内发挥更大的作用。

   值得注意的是,DeepSeekV3大模型发布后便完全开源,且其训练成本远低于同类模型。根据SemiAnalysis的数据,OpenAI的GPT-4训练成本高达6300万美元,相比之下,DeepSeek-V3的成本仅为其十分之一不到。 这一举措无疑为人工智能领域的发展注入了新的活力。DeepSeekV3不仅降低了行业进入门槛,还通过开源加速了技术进步的步伐。这种高性价比的大模型对于科研机构和中小企业来说尤其具有吸引力,有助于推动更多创新应用的诞生。同时,这也反映出在大模型训练方面,可能存在着更优化的资源利用方案和技术路径。

   此外,DeepSeekV3模型的训练是在2000块英伟达H800 GPU上完成的,这一数量远少于硅谷大厂通常使用的数万块更高端的GPU。这一突破克服了国产大模型在算力芯片方面的限制,为创业团队开辟了新路径:即使在算力资源有限的情况下,通过采用高质量的数据和更优秀的算法,也能训练出高性能的大模型。

   OpenAI创始团队成员Andrej Karpathy在帖子中表示,DeepSeek-V3的表现优于Llama3的顶级模型,同时所需资源仅为后者的一成。“未来或许不再需要庞大的GPU集群了”。

   田渊栋赞叹道:“FP8格式的预训练、混合专家模型(MoE)、在资源极其有限的情况下仍能展现出色性能、并且能够从思维链(CoT)中高效提取信息用于引导……哇!这是一项了不起的成就!” 这种技术突破不仅展示了研究团队在深度学习领域的深厚积累,而且为未来AI系统的开发提供了新的思路和方法。FP8格式的应用和MoE模型的创新,都表明了研究人员正在不断寻找更有效的计算方式来提升机器学习的效率与效果。在资源有限的条件下达到如此优异的表现,更是证明了这项技术在实际应用中的巨大潜力。

   DeepSeek的创始人梁文锋对硅谷的赞叹并不觉得奇怪。他认为,这是因为DeepSeek作为一家中国企业,正以创新参与者的角色加入到全球AI技术的竞争之中。他强调,中国应该逐渐转变为技术的提供者,而不仅仅是依靠西方的创新成果。

   梁文锋还指出,中国在人工智能领域的发展需要构建自己的技术生态系统,正如西方主导的技术社区通过一代代的努力创造了摩尔定律和Scaling Law。他提到,许多国产芯片未能取得进展,关键原因在于缺乏相应的技术社区支持以及前沿技术的积极参与。

   据公开资料,幻方量化作为DeepSeek的母公司,最初是以量化基金起家,其用人风格与DeepSeek相似,都倾向于使用本土人才。在DeepSeek的AI产品正式发布之前,公司曾长期对其进行内部孵化,并招聘了文科背景的人才来提供专业知识。这一独特的发展历程使DeepSeek在AI领域脱颖而出,成为中国的AI技术创新先锋。