亚马逊全新发布“Nova Act”:操控网页浏览的先进人工智能助手

admin532025-04-01 12:41:01

亚马逊发布通用AI智能体Nova Act,引领智能体技术新篇章

4月1日,IT之家快讯——亚马逊在当地时间周一正式对外发布了其最新的通用人工智能智能体——Nova Act。这一智能体不仅能够操控网络浏览器,还能自主执行简单的网络任务,为人工智能领域注入了新的活力。

Nova Act:开发者利器,助力构建智能体原型

亚马逊同时推出了Nova Act软件开发工具包(SDK),旨在协助开发者利用Nova Act构建智能体应用原型。据悉,Nova Act是由亚马逊在旧金山新近成立的AGI(通用人工智能)实验室研发的,该技术未来将为备受瞩目的生成式AI增强版语音助手Alexa+提供关键功能支持。

然而,亚马逊方面透露,今日开放的版本为“研究预览版”,意味着其功能仍在不断完善中。

获取Nova Act工具包,探索亚马逊AI模型世界

开发者可通过新设立的专属网站nova.amazon.com获取Nova Act工具包。该网站不仅是获取工具包的入口,同时也是亚马逊展示旗下各类Nova基础模型的平台。

Nova Act:加入AI智能体竞争,潜力巨大

Nova Act的发布标志着亚马逊正式进军AI智能体技术领域,意图通过自主研发的通用AI智能体技术,与OpenAI的Operator和Anthropic的Computer Use等产品展开竞争。目前,多家领先科技公司普遍认为,能够代替用户浏览网页、执行任务的AI智能体将极大提升现有AI聊天机器人的实用性。

尽管亚马逊并非首家开发此类技术的公司,但凭借其庞大的Alexa用户基础,Nova Act未来可能拥有最广泛的应用潜力。

Nova Act SDK:自动化网络操作,提升用户体验

亚马逊介绍称,开发者使用Nova Act SDK,将能够为用户自动化处理一些基础性网络操作,例如从餐饮品牌Sweetgreen订购沙拉或是在线上预订餐厅晚餐。该工具包提供了一系列工具,使AI智能体能够浏览网页、填写表单、在日历上选择日期等。

性能卓越,超越同行

在性能方面,亚马逊声称,在公司内部的多项测试中,Nova Act的表现优于来自OpenAI和Anthropic的同类智能体。以衡量AI智能体与屏幕文本交互能力的ScreenSpot Web Text测试为例,Nova Act得分高达94%,超过了OpenAI的CUA(88%)和Anthropic的Claude 3.7 Sonnet(90%)。然而值得注意的是,亚马逊并未公布Nova Act在如WebVoyager等行业更常用的智能体评估基准上的测试结果。

AGI实验室的首次公开产品,专家团队领衔

Nova Act是亚马逊上述AGI实验室对外发布的首个公开产品。该实验室由前OpenAI研究员David Luan和Pieter Abbeel共同领导。这两位专家在去年被亚马逊聘用以主导其AI智能体研发工作之前,分别创立了AI初创公司Adept和Covariant。

智能体构建超智能AI系统,开发者期待

对于为何一个以AGI为目标的实验室会开发订购沙拉的AI智能体,Luan在接受TechCrunch采访时解释道,他将智能体视为构建超智能AI系统的关键一步。他将AGI定义为“一个能够帮助你在计算机上完成人类所能做的任何事情的AI系统”。Luan还表示,其团队设计的Nova Act SDK旨在可靠地自动化执行简短、简单的任务,并为开发者提供了精确定义何时需要人类介入智能体工作流程的工具。他希望借此帮助开发者创建更可靠的智能体应用,即使这些应用不一定是完全自主运行的。

挑战与机遇并存,市场拭目以待

目前,来自OpenAI、谷歌和Anthropic等公司的早期AI智能体普遍面临跨不同领域应用时可靠性不足的重大挑战。根据TechCrunch等媒体的测试,这些系统往往运行缓慢,难以长时间独立工作,且容易犯下人类通常不会犯的错误。亚马逊是否已经找到了克服这些难题的有效方法,还是其Nova Act智能体也将受困于同样的缺陷,市场将拭目以待。