虎嗅科技组出品
作者:孙晓晨 编辑:苗正卿 头图:视觉中国
OpenAI发布新工具,应对Manus压力
在3月12日,OpenAI推出了专为Agent应用程序开发而设计的全新工具集,这一举措被视为对Manus项目压力的直接回应。
Manus用户激增,全球关注热度攀升
据ManusAI在社交平台X上最新公布的消息,目前已有200万用户翘首以盼,希望体验Manus。尽管Manus尚未正式进入市场,但它已经吸引了广泛的关注。在经历了刷屏级传播、市场炒作的质疑以及社交平台账号封禁等一系列挑战后,Manus的热度不仅在国内持续升温,其在海外的关注度也在不断上升。
媒体评价不一,Manus定位模糊
福布斯和TechCrunch等国际媒体对Manus进行了报道,但观点各异。福布斯将其称为“世界上首个完全自主的人工智能代理”,并声称该智能体有潜力取代人类。而TechCrunch的记者Kyle Wiggers则持谨慎态度,指出Manus并未完成诸如点餐、预订座位或生成游戏等任务,且并非基于新开发的内部模型。Wiggers认为,Manus似乎是一个炒作先于技术创新的案例。
Manus在海外获得认可,但也有质疑声音
媒体的评价分歧反映了Manus目前定位的模糊性,有人认为它是AGI的先驱,也有人认为它只是营销的产物。Manus的邀请码制度也使得这款产品在公众面前显得神秘莫测。
随着讨论的深入,除了知名媒体的报道,海外知名博主Rowan Cheung也在社交平台X上发布了关于Manus的评测。他的博文阅读量已超过280万,创下了个人历史最高互动纪录。Rowan Cheung将Manus的出现称为“中国的第二个DeepSeek时刻”,并对其进行了三项任务的测试,包括部署网站、选择旧金山理想的租房地点以及创建一门AI课程,Manus均顺利完成。
Manus的优势与挑战并存
Rowan Cheung还提到,在GAIA基准测试中,Manus的表现令人印象深刻,甚至超越了OpenAI最近推出的Deep Research。另一位科技博主Julian Goldie也对Manus给予了高度评价,甚至取消了每月200美元的ChatGPT订阅,他认为Manus在多方面具有优势。
然而,并非所有测评者都对Manus给出好评。社交平台X博主Alexander Doria在测试中遇到了错误信息和无限循环的问题,而The Jackson Laboratory教授Derya Unutmaz的横向测试结果显示,Deep Research在15分钟内完成任务,而Manus在步骤18/20时失败,用时50分钟。
Manus的市场反响与未来展望
尽管有人将Manus视为“中国的第二个DeepSeek时刻”,并且该产品已受到海外关注,但从谷歌趋势来看,Manus的全球搜索热度在过去一周仍远低于DeepSeek,且流量主要来自中国。此外,其他博主也反馈了Manus在事实性问题上的错误以及在STEM领域协助和编程方面的不足。
总体来看,Manus的正面评价主要集中在复杂任务的执行能力、多模态工具整合以及成本优势上,而稳定性不足和事实性缺陷则是用户们的主要吐槽点。
除了媒体和用户,诸如JPM、GS、UBS等海外投行也开始关注Manus,这表明尽管产品尚未正式推出,但已经在市场上引起了反响。
结语
不同于DeepSeek从海外转向国内的火爆路径,Manus此前一直被视为“国内火爆,海外冷淡”。随着海外热度的提升,对Manus的认知和评价也变得更加理性。随着对Manus的讨论持续升温,全球AI话语权的归属问题再次成为焦点。对于Manus这一AI产品而言,挑战或许才刚刚开始。
原文链接:虎嗅科技组
注:以上内容为改写,排版符合博客发布格式,并适当扩充了部分内容以丰富信息。