中国生成式 AI 领域崛起!吴恩达盛赞 DeepSeek,超越美国势不可挡
中国AI崛起,DeepSeek引领全球变革
2月1日消息,斯坦福大学计算机科学系客座教授吴恩达(AndrewYan-TakNg)昨日在X平台发文支持DeepSeek:“中国在生成式AI领域正在迅速追赶美国”。
附吴恩达观点大意如下:
本周关于DeepSeek的讨论让人们更加清晰地看到了几个显而易见的发展趋势:随着技术的进步,人工智能领域的竞争日益激烈。DeepSeek作为新兴的技术平台,不仅在技术创新上展现出强大的实力,也在不断拓展其应用领域,为行业带来了新的活力。这表明,在未来的人工智能市场中,那些能够持续创新并适应市场需求的企业将占据更有利的位置。 这一系列的讨论也引发了对数据安全与隐私保护的关注。随着DeepSeek等技术的广泛应用,如何平衡技术创新与用户隐私保护成为了一个亟待解决的问题。企业必须在推动技术发展的同时,加强对于用户数据的管理和保护,以赢得用户的信任和支持。 总体来看,DeepSeek的发展趋势反映了当前科技行业的动态变化,也为未来的科技创新提供了重要的参考。
中国正加快步伐在生成式AI领域追赶美国,这一动向对全球AI供应链造成了重大影响。
开放权重模型正逐渐将基础模型层转化为一种商品化的产品,这无疑为应用开发者带来了更多的机遇。这一趋势表明,随着技术的进步,构建基于这些模型的应用程序变得越来越容易和高效。对于开发者而言,这意味着他们可以更专注于创新和差异化,而不是从零开始搭建底层架构。这种转变不仅有助于加速新技术的普及,还可能促进更多样化和高质量的应用程序进入市场。总体来看,这是一个积极的发展,预示着未来科技领域将有更大的突破和更多的可能性。
扩大规模并不是促进AI发展的唯一方式。尽管计算能力方面受到了极大的关注和炒作,但算法的创新正在快速地减少训练所需的开支。
大约一周前,总部设在中国的DeepSeek近日推出了其备受关注的DeepSeek-R1模型,在基准测试中表现出色,堪比OpenAI的o1模型。更值得一提的是,DeepSeek-R1以开源形式发布,并采用较为宽松的MIT许可证。上周在达沃斯论坛上,多位来自非技术行业的商业领袖向我咨询了关于该模型的信息。而在本周一,股市出现了所谓的“DeepSeek效应”:英伟达以及其他几家美国科技公司的股价显著下滑。(目前,部分股票价格已有所恢复。)
DeepSeek 让许多人意识到以下几点:
中国在生成式 AI 领域正赶超美国。2022 年 11 月 ChatGPT 发布时,美国在这一领域远远领先于中国。然而,过去两年里,中国的进步非常迅速,许多来自中国的模型,如通义千问(我的团队已经使用了几个月)、Kimi、书生 InternVL 和 DeepSeek,已经显著缩小了与美国的差距,尤其在视频生成领域,中国已在某些时刻超越了美国。
我对DeepSeek-R1作为开放权重模型发布感到非常兴奋,同时其技术报告中提供的详细信息让人印象深刻。相比之下,某些美国公司似乎更倾向于利用虚构的AI危机,如人类灭绝的假设,来推动更为严格的监管措施,这实际上是在试图遏制开源项目的发展。 这种行为不仅阻碍了技术创新与进步,而且也在某种程度上反映了这些公司在面对新兴技术时的短视态度。开源模型的兴起为科研人员和开发者提供了一个更为广阔的合作平台,促进了知识共享和技术迭代。因此,我们应该支持那些致力于促进技术发展的开源项目,而不是被那些基于恐慌的言论所左右。
如今,开源/开放权重模型已成为AI供应链的关键部分,众多公司正广泛采用这些模型。若美国持续限制开源,中国最终可能在这一领域占据领导地位。届时,许多企业将倾向于选择更加契合中国价值观的模型,而不是依赖美国的模型。 这种趋势不仅反映了技术竞争的全球化态势,也揭示了地缘政治因素对科技发展的影响。随着各国对于自主可控的技术需求日益增强,开源生态系统的未来走向或将面临重大调整。美国若继续采取强硬措施,可能会加速这一转变过程,促使全球科技格局发生深刻变化。
开放权重模型正在加速基础模型层的商品化。正如我之前提到的,大语言模型 token 价格迅速下降,开放权重模型加剧了这一趋势,也让开发者拥有更多选择。OpenAI 的 o1 每百万输出 token 的费用为 60 美元,而 DeepSeek-R1 的费用仅为 2.19 美元,这种近 30 倍的价格差异引起了许多人的关注。
基础模型的训练与API销售业务确实面临诸多挑战。许多公司仍在努力寻找有效途径以回收巨大的训练成本。正如红杉资本所指出的,《AI的6000亿美元问题》揭示了这个行业的困境。尽管如此,我相信基础模型公司拥有克服这些困难的能力,并期待它们取得成功。相较之下,在基础模型之上构建应用程序则展现出更多的商业机遇。鉴于其他公司已经投入数十亿美元用于训练这些模型,现在的开发者只需支付相对较低的成本即可使用它们来创建客户服务机器人、邮件摘要工具、AI医生以及法律文件助手等应用。 这样的发展态势不仅预示着技术进步带来的可能性,也提醒我们关注创新背后的资金压力和技术迭代的速度。对于那些考虑投资或参与此领域的企业和个人来说,理解这些挑战和机遇至关重要。这不仅是技术上的突破,更是商业模式和市场策略的考验。
扩大规模并不是AI发展的唯一路径。近年来,围绕模型的规模扩展成为推动AI进步的一个重要议题。我过去也曾是这一观点的支持者之一。很多公司借此话题大肆宣传,声称通过增加资金投入,可以实现更大规模的模型,并且能够预期性地促进技术进步。因此,规模扩展成为了主要关注点,而忽视了其他可能的进步方式。由于美国对AI芯片实施禁运,DeepSeek团队不得不使用性能较低的H800 GPU来代替H100 GPU,最终使模型训练的计算成本(不包括研究费用)控制在600万美元以内。
是否这会减少计算需求仍有待观察。降低每单位产品的价格有时会刺激人们在该产品上花费更多的总金额。我认为,在长期内,对于智能和计算的需求几乎没有上限,因此,即便成本下降,我对人类对智能需求的增长依然持乐观态度。
我注意到有关DeepSeek在X上的各种讨论,感觉它像一面镜子,映照出每个人独特的观点。我认为DeepSeek-R1所涉及的地缘政治议题仍需进一步探讨,但同时也为AI应用开发者提供了巨大的机遇。我们团队已经开始酝酿一些创新思路,这些思路唯有借助开放且先进的推理模型才能实现。现在正是大展身手的最佳时机!