AI界三大重磅新闻:中国科技叙事再升级
昨晚至今晨,AI领域接连爆出三则重大新闻,中国科技的故事正不断被续写。
阿里通义开源全新RL模型
阿里通义兑现承诺,新RL模型开源亮相
正如之前所预告,阿里通义昨晚正式开源了一款新的RL模型。这款模型在性能上堪称卓越,其32B的版本在性能上与DeepSeek R1相当。在AIME24评测集的数学能力测试和LiveCodeBench的代码能力评估中,千问QwQ-32B的表现与DeepSeek-R1持平,且远超o1-mini及同等规模的R1蒸馏模型。目前,这款模型已可在通义APP和网页端进行体验。
RL训练效率提升,阿里创新反馈机制
此外,值得注意的是,这次RL训练的过程似乎并未耗费过多时间。据阿里内部人士透露,与以往奖励传统模型不同,此次是通过验证生成答案的正确性为数学问题提供反馈。
高性能大模型本地部署门槛降低
随着高性能大模型的本地部署门槛进一步降低,现在仅需一台配备4090显卡的Mac mini(内存大于24G,且支持苹果架构内存GPU共享)即可部署。在国家补贴的支持下,成本控制在4位数以内。
RL潜力再被放大,智能硬件能力提升在即
这一变化无疑进一步放大了RL的潜力,智能硬件能力的提升可能指日可待。应用需求有望迎来爆发,这对Agent的发展无疑是一个利好消息。
苹果Mac studio本地部署DS-R1
苹果最新发布的Mac studio,以7万美元以上的价格即可本地部署DeepSeek R1,预计性能可达20token/s;R1的本地化门槛大幅降低,从70多万降至7万多。
Manus AI引发热议
由Monica团队打造的Manus AI近期引发热议(尽管明显是软文推广),但这也反映出市场对Agent能力的认知和期待正在提升,尤其是在算力方面的期待。
中国科技公司在AI领域的持续重估
这三则新闻无疑将再次改变市场对AI的叙事。可以预见,RL的大规模强化学习scaling law已经显现,以阿里为代表的中国科技公司将持续迎来价值重估。
⭐关注华尔街见闻,不错过精彩内容⭐
重要提示:
本文仅供参考,不构成个人投资建议,不代表平台观点。市场有风险,投资需谨慎,请独立判断和决策。
喜欢本文,请点“在看”支持我们!