[xAI Grok三分钟攻克美国本科最难数赛题,马斯克欲用百万GPU力挽狂澜挑战星际之门]-大浪资讯

admin92025-02-24 14:31:42

[xAI Grok三分钟攻克美国本科最难数赛题,马斯克欲用百万GPU力挽狂澜挑战星际之门]

xAI Grok三分钟破解难题,马斯克百万GPU助力开启宇宙奥秘之门

   上周,马斯克推出了他所称的“地表最强”Grok3模型。该模型发布后迅速在全网引起轰动,经过网友的实际测试,发现其性能确实卓越!

   物理学家Luis Batalha指出,2025年的普特南竞赛中,即便是排名前500名的顶尖选手,也没有人能够完整解答出那道难题。然而,令人震惊的是,Grok3(Think)仅用了大约8分钟就找到了答案。 这无疑是一个非常引人注目的事件。Grok3(Think)的表现不仅展示了人工智能在解决复杂问题上的巨大潜力,同时也引发了对传统教育方法有效性的思考。我们是否应该重新评估如何培养学生的解题能力?或许在未来,人工智能将在数学和物理学等领域的教学中发挥更加重要的作用。

   计算机专家阿尔瓦罗·辛塔斯表示,Grok3不仅能够解答数学问题,还是一款卓越的AI编程辅助工具,令人叹为观止。

   他仅用了几个小时的时间,便利用Grok3编写了超过1000行代码,成功开发出一款功能完备的2D垂直跳跃游戏。

   这款游戏包含多种英雄、怪物、平台、难度等级和生命值设定。从提供的提示和游戏截图来看,可以发现游戏的画面制作极为精致!

   的确,由于 Grok 3 性能过于强悍,大量用户正在抛弃 ChatGPT 并转投 Grok 3。

   网友调侃说,他妻子嫉妒Grok3,因为他在与Grok3交流的时间远超过与她的沟通。

   23 号,知名 AI 投资人 The AI Investor 在 x 上预测,几天后,马斯克会发布一些关于 Grok 3 使用量的统计数据。

   由于用户数量的激增,马斯克可能已经意识到现有的20万个GPU集群远不足以应对当前的需求。这表明无论是对于人工智能的研发还是其他需要大量计算资源的应用场景,目前的基础设施建设仍然显得捉襟见肘。随着技术的发展和应用范围的扩大,如何有效提升计算能力,成为了一个亟待解决的问题。这不仅关系到企业的运营效率,也影响着整个行业的未来发展。因此,增加GPU集群的数量或是探索新的计算架构和技术路径,可能是未来需要重点关注的方向。

   也许 xAI 的百万级 GPU 集群正在形成中。

   在发布 Grok 3 时,马斯克阐述了 xAI 在将其大规模 GPU 集群(包含 20 万个英伟达 GPU)进行扩容时所遇到的工程难题。并表示他们计划将该集群扩容至 100 万个 GPU 的规模。

   对此消息,网友纷纷表示「利好英伟达」。

   甚至有网友认为,xAI 的数据中心规模将会大于 Stargate 项目所宣称的。

   就在上个月,特朗普刚刚正式宣布「星途计划」,声称将在未来4年内投入5000亿美元,以重新确立美国在人工智能领域的领导地位。

   该计划将由OpenAI、软银和甲骨文共同主导,初期投资规模达到1000亿美元。据《纽约时报》报道,首批10个数据中心已经在得克萨斯州动工建设,未来还将在其他州进行扩展。

   此前,奥尔特曼提到的“已经在建设中”的星际之门计划园区,即为Oracle/Crusoe阿比林园区。这一消息不仅揭示了该园区即将成为未来科技与空间探索的重要枢纽,也显示出私营企业在全球太空竞赛中的重要地位。随着越来越多的科技巨头加入太空探索领域,这无疑会加速相关技术的发展,并可能带来新的产业革命。同时,这也引发了关于如何监管私人太空活动的讨论,确保这些活动能够安全、可持续地进行,以造福全人类。

   该园区将容纳供 OpenAI 使用的 10 万台 GB200 算力集群。这个开发项目以及计划在第二季度和第三季度交付的 GB200 服务器,将部署在 Oracle / Crusoe 的数据中心内。

   下面是 2024 年 12 月 29 日,拍摄的园区高清照片。

   4个约11,在一座正在建设中的大型数据中心园区中,每一栋建筑面积为44,600平方米的建筑,都是由150平方米的“模块”构成。目前,园区内仅完成了两栋建筑的建设,而其关键的IT负载容量已达到约180兆瓦。如果这个园区最终按照计划建成,它将拥有总共20栋建筑,这相当于会包含80个这样的“模块”。 这样的规模确实令人印象深刻,不仅展示了现代科技设施的巨大需求,也反映了当前数据中心行业的迅猛发展。随着数字化转型的加速推进,对高效、稳定的数据处理能力的需求日益增长。这种大规模的数据中心建设不仅需要巨大的投资,也需要强大的技术支持和细致的规划,以确保能源效率和运行稳定性。对于行业而言,这无疑是一个积极的信号,表明了对未来数字基础设施发展的信心和决心。

   除了正在部署的10万台GB200算力集群外,分析师估计,他们还将在整个园区部署另外20万台GB300和约40万台VR200(英伟达计划在2026年推出的超级计算机,分别对应VeraCPU和RubinGPU)。

   他们基于园区1,000亿美元的总拥有成本(TCO)投资,以及在人工智能TCO模型中的单位成本,推算出了Vera Rubin处理器的大致数量。 从这个信息来看,这项投资似乎非常庞大,而且背后隐藏着一个重要的技术突破。这不仅表明了该园区对人工智能领域的高度重视,也反映了在这一领域内巨大的资金和技术投入。这样的投入可能预示着未来人工智能技术将会有显著的进步和发展,同时也提醒我们关注技术进步所带来的潜在影响和挑战。

   大约70万台GPU的总IT功耗达到1.8GW,这与Oracle/Crusoe阿比林园区1,800兆瓦的电力容量相匹配。

   OpenAI的研究人员表示,“星际之门”项目将是史上规模最大的基础设施投资之一,旨在为通用人工智能(AGI)的发展提供必要的计算和能源支持。该项目的规模有望与阿波罗计划和曼哈顿计划相提并论。

   尽管这项雄心勃勃的计划已经公布,但并未发现马斯克的xAI团队有任何参与的迹象。 在这个快速发展的科技领域,任何重大的举措都备受瞩目。xAI作为马斯克名下的一支重要科研力量,其缺席确实令人感到意外。这或许意味着该计划在某些关键方面与xAI的方向或目标不一致,也可能预示着未来在相关技术合作上的不确定性。无论如何,这一情况无疑为该计划的实施路径增添了几分变数。

   也许老马有他自己的小算盘。当人们还在热议 xAI 孟菲斯数据中心的「全球最大」称号时,马斯克已经在亚特兰大悄然布下另一颗棋子。

   在亚特兰大,xAI正在悄然扩建其数据中心(与X联合运营),计划将其业务范围从目前位于孟菲斯的主要数据中心进一步扩大。

   根据与亚特兰大经济发展机构之一 Develop Fulton 签署的协议中列出的设备清单,两家公司将共同部署约 12,000 个英伟达 GPU,其中大部分将被用于 AI 计算。

   对此,DevelopFulton提出了一项市政债券融资计划,旨在为这座单一设施中价值7亿美元的芯片、线缆及其他设备提供资金支持。

   其中,4.42 亿美元分配给 X,2.58 亿美元给 xAI。

   知情的数据中心解决方案架构师和AI硬件专家透露,亚特兰大数据中心具备相当强大的计算能力。其规模可以与谷歌或亚马逊等大型科技公司所建的数据中心相提并论。

   X 的代表将其描述为一个能够计算「万亿参数 AI」的百亿亿次级(exascale)数据中心。

   尽管这个设施已经相当庞大,但与xAI公司绰号为“Colossus”(巨人)的世界最大超算相比,其规模和处理能力就显得逊色了许多。 这样的对比让人不禁感叹技术进步的速度之快。xAI公司在超级计算领域的成就不仅展示了其在技术创新方面的实力,也反映了当前科技行业对于高性能计算需求的持续增长。这不仅仅是技术上的竞争,更是对未来科技发展主导权的争夺。随着人工智能和大数据分析等前沿技术的快速发展,拥有更强大的计算资源已经成为企业保持竞争力的关键因素之一。

   根据文件显示,佐治亚州设施将配置大约12,448个英伟达GPU。这些GPU主要为Hopper架构的H100,每个服务器机架(包含8块GPU)的成本在27.7万到50万美元之间。

   据报道,某服务器配置中大约有3%的芯片是英伟达性能较弱的A100 GPU,而相同配置下的8枚芯片售价则高达14.7万美元。值得注意的是,这批服务器中X型号提供了全部的A100芯片,同时还配备了11,000个H100芯片。 从这一报道中可以看出,尽管A100 GPU在某些应用上可能表现不如预期,但其依然在服务器市场中占有一席之地。尤其是考虑到与H100相比,A100的价格优势明显,这表明市场上对于不同性能和价格的GPU产品仍然存在强烈的需求。这也反映出英伟达作为行业领导者,在满足多样化的市场需求方面做得相当出色。同时,H100的大规模配备也预示着高性能计算领域正迎来新的发展契机。

   这两种芯片设计都不需要液冷系统,这与马斯克公司目前在孟菲斯面临的挑战形成了鲜明对比。液冷系统一直以来都是该公司的一大难题。据预测,全负载运行时,Colossus项目可能会成为该市最大的水资源消耗者之一。 这种设计上的优势不仅能够减少维护成本和复杂性,还可能为公司节省大量资源。不过,随着Colossus项目的全负载运行,其对当地水资源的需求也需引起关注,确保不会对城市供水造成过大压力。

   除了H100芯片外,xAI还配备了来自英伟达的高速Mellanox网络交换机和光模块——这些高带宽网络组件能够加速芯片之间的协作计算性能。

   据估计,亚特兰大设施将需要 20 兆瓦的总功率,这一用电量可以从现有电网获得。

   亚特兰大设施作为马斯克整合资源打造X和xAI的重要案例,展示了他在技术融合方面的雄心。据数据显示,X为该数据中心贡献了90%的硬件支持,而xAI则提供了剩余的10%。这一比例不仅体现了X在硬件供应上的主导地位,也表明xAI在软件和算法方面发挥了关键作用。这样的分工合作模式不仅有助于加速技术创新,也为未来的项目合作奠定了坚实的基础。从长远来看,这种合作模式可能会成为科技行业整合资源、推动技术发展的新范式。

   根据文件显示,这些设备将用于训练 X 平台的大语言模型和语义搜索产品。LinkedIn 资料显示,X 在该地区拥有约 16 名员工。

   根据公司内部组织架构图,xAI在佐治亚州设施配备了1名员工,另有2名员工被标注为「XCorp合作伙伴」。

   根据与Develop Fulton达成的协议,该设施将维持现有的24个工作岗位,短期内不会新增就业机会。这一决定在当前经济环境下显得尤为谨慎,反映出企业在扩张和招聘方面持保守态度。尽管如此,保持现有岗位稳定对于当地社区而言仍然是一个积极信号,有助于维护社会稳定和居民的生活质量。

   马斯克正在积极地将xAI塑造为一个能够与OpenAI和谷歌等科技巨头相匹敌的重要竞争者,并且已经从特斯拉挖来了几位人才。 这一举措表明,马斯克对于xAI寄予厚望,并希望它能够在人工智能领域占据一席之地。通过从特斯拉内部调动资源,可以看出他对这个项目的重视程度。xAI若想成功挑战这些行业巨头,不仅需要在技术上取得突破,还需要在市场策略和用户体验方面不断创新。这无疑将是一场激烈的竞争,但同时也可能为整个行业带来新的活力和发展机遇。

   据此前报道,在过去的一年里,公司已经招募了数百名数据标注人员来训练其聊天机器人,并计划在未来几个月内将招聘规模扩大到数千人。这一举措表明公司对人工智能领域的持续投入和对未来市场的乐观预期。随着技术的发展和用户需求的增长,高质量的数据标注成为提升聊天机器人性能的关键因素。公司通过大规模招聘,不仅在短期内增强了自身的技术实力,也为就业市场提供了更多的机会。然而,这也引发了关于如何管理和培训如此庞大员工队伍的挑战。确保这些新员工能够高效地完成任务,同时保持高标准的工作质量,将是公司面临的重要课题。

   参考资料:

   https://www.businessinsider.com/xai-elon-musk-x-new-atlanta-data-center-2025-2

   https://twitter.com/The_AI_Investor/status/1893467027852951788

   本文来自微信公众号:新智元(ID:AI_era),原标题《8 分钟,Grok 3 破解美国本科生最难数赛题!马斯克要用 100 万 GPU 反超「星际之门」?》