OpenAI Operator:革新网页交互体验的智能浏览器助手
引领浏览新时代,改变网页互动方式
1月24日消息,OpenAI公司于1月23日发布了新的博文,宣布推出名为“Operator”的AI智能体,该智能体能够利用自己的浏览器为用户执行各种任务。目前,这一功能仅对美国地区的Pro订阅用户开放。 这一举措标志着人工智能技术在实际应用中的又一重要进展。通过让AI智能体拥有自主浏览网络的能力,“Operator”不仅能够更高效地获取信息,还可能在多个领域内为用户提供更加个性化的服务。然而,随之而来的还有关于隐私保护和技术监管的新挑战,如何确保这些智能体在提供便利的同时不会侵犯用户的隐私权,将是未来需要重点关注的问题。此外,考虑到当前仅限于特定地区的用户使用,未来是否能够普及到全球范围,也将影响这一技术的实际效果和价值。
据博文介绍,Operator采用其专用浏览器,能够完成填写表单、在线购物以及制作表情包等各类重复性浏览器任务。
Operator服务现已面向美国的Pro版订阅用户推出,网址为operator.chatgpt.com。随后,该服务还将扩展至Plus、Team及Enterprise用户,并计划在未来将这些功能整合进ChatGPT平台。
Operator由一种名为Computer-UsingAgent(CUA)的新模型驱动。CUA融合了GPT-4的视觉能力和通过强化学习获得的高级推理能力,经过训练能够与图形用户界面(GUI,即人们在屏幕上看到的按钮、菜单和文本字段)进行互动。
运营商能够通过屏幕截图“观察”浏览器内容,并利用鼠标和键盘执行所有允许的操作来进行“互动”。这样,他们可以在不需定制API集成的情况下,在网络上执行相应操作。