小而强大:IBM CEO认可DeepSeek在证明高效模型的同时取得实质成果
深度搜索:深度学习技术引领IBM CEOs改变传统认知
2月7日消息,当地时间2月4日,IBM首席执行官Arvind Krishna在《财富》杂志上发表了一篇长文,分享了他对DeepSeek以及整个人工智能行业的见解和未来展望。 在我看来,Krishna的文章不仅体现了IBM在人工智能领域的持续探索,也反映了整个科技行业对于AI技术未来的乐观态度。DeepSeek作为一个新兴的人工智能项目,其背后蕴含的巨大潜力无疑吸引了全球的关注。Krishna的观点强调了技术创新的重要性,同时也提醒我们在追求技术进步的同时,需要关注伦理和社会影响。随着人工智能技术的发展,如何平衡技术革新与社会责任,将是未来我们必须面对的重要课题。
附 Arvind Krishina 的观点大意如下:
上周,一直以来,人们普遍认为训练最先进的AI模型需要投入超过10亿美元,并且依赖于数千枚最新芯片。AI必须是专有技术,只有少数几家公司具备开发它的能力,因此保密至关重要。然而,DeepSeek的出现打破了这种传统认知。这项技术的突破表明,即使在资源有限的情况下,也有可能开发出高性能的AI系统。这不仅为更多企业打开了大门,也为AI技术的发展提供了新的可能性。或许未来的AI领域不再被少数巨头垄断,而是更加开放和多元化。
但DeepSeek的做法打破了这一传统观念。新闻报道称,他们仅使用约2000块英伟达芯片,以大约600万美元的成本训练了最新的模型,远远低于行业预期。这再次证明,小型且高效的模型同样能够取得实质性的成果,无需依赖庞大而昂贵的专有系统。
然而,这一进展引发了一个更为深刻的问题:AI的未来究竟由谁来掌控?AI的发展不应被少数几家企业所垄断,特别是这些企业在数据保护、隐私和透明度等核心价值观方面可能存在差异。解决之道并非遏制技术的进步,而是促进更广泛的协作,确保大学、企业、研究机构以及社会组织能够共同参与到AI的建设中来。
替代方案是,AI 的主导权可能会落入价值观和优先事项不同的参与者手中,这意味着未来社会和产业变革的关键技术将不再受掌控。真正的创新和进步,只有在 AI 的开发权得到广泛共享的前提下才能实现。
AI行业已经告别了炒作阶段。2025年,AI技术需要摆脱少数大企业的封闭体系。到2026年,社会各界不仅应广泛采用AI,还应该积极参与其研发工作。
开源的小模型将成为实现这一目标的关键。DeepSeek 的成功说明,真正出色的工程技术应当在性能和成本之间找到最佳平衡。过去,行业普遍认为更大规模的模型才能带来更好表现,但真正的突破并不在于规模,而在于效率。我们在 IBM 的研究表明,针对特定应用优化的模型已经将 AI 推理成本降低了最多 30 倍,使训练更高效、更易获取。
我并不认为AGI(人工通用智能)即将实现,也不认同未来的AI(人工智能)需要依赖庞大的核能数据中心。这种论调人为制造了错误的选择题。AI的高昂成本并非必然,它只是一个尚待解决的工程挑战。无论是成熟企业还是初创公司,都有能力通过技术创新和优化流程来推动成本下降,使AI技术更加实用且普及。 我认为,随着技术的进步和市场竞争的加剧,AI的成本将会逐步降低,这不仅取决于大型科技公司的努力,也与众多初创企业的创新息息相关。只有不断探索新的技术和方法,才能真正实现AI技术的广泛应用和普及。此外,政策制定者也应该提供相应的支持,为AI的发展创造更好的环境。
历史上早有先例。在计算机发展的初期,存储和计算能力的成本非常高昂。但是,随着技术的进步和规模经济的影响,这些成本迅速降低,从而促进了计算机的普及和各种创新。
AI的发展路径也将遵循这一趋势。这对于全球企业来说是一个好消息。唯有当技术变得经济实惠且易于获取时,才能真正改变世界。通过采用开放和高效的AI模型,企业能够寻找到更符合成本效益且满足自身需求的解决方案,从而释放AI在各个行业的巨大潜能。