当前位置:首页 > 创业 > 正文

OpenAI发布能订餐、购物的Operator,高管称智能体之年来了

  • 创业
  • 2025-01-24 14:47:25
  • 10

  当地时间周四,OpenAI发布了自主智能体Operator。在本月OpenAI推出新功能Tasks,被认为产品方向开始转向AI智能体后,OpenAI有了更实质性的动作。

  据OpenAI介绍,Operator可以代理用户执行基于网页的操作,例如查看、输入、点击、滚用网页,Operator是OpenAI最早的智能体之一。目前Operator还是研究预览版本,功能上有局限性,美国的ChatGPT Pro会员可以使用该功能。

  在20多分钟的介绍视频中,OpenAI演示了Operator如何用于处理各种复杂的网页任务,如填写表单、订购货物。在演示中,操作人员要求Operator预定某家餐厅傍晚7点的座位,Operator就会自动打开网页进入预订网站,搜索餐厅并完成预定。当Operator发现该时间点餐厅座位已经订完,就会询问用户是否改订7点45分的餐厅。如果上传一张写有鸡蛋、菠菜、蘑菇、鸡肉等食物的购物清单图片,Operator则会打开网页并搜索这些物品、加入购物车。Operator也能帮助用户订购外卖。

OpenAI发布能订餐、购物的Operator,高管称智能体之年来了

OpenAI发布能订餐、购物的Operator,高管称智能体之年来了

  从视频中看,Operator的操作页面与ChatGPT的页面非常相似,用户可以在对话框中向Operator提出要求。据OpenAI介绍,支撑Operator的模型则是CUA(计算机代理使用)模型。CUA结合了GPT-4o的视觉能力,且有高级推理能力,CUA可与用户的图形界面交互,“看到”屏幕上的按钮、菜单和文本,也可以执行鼠标和键盘可执行的操作。在CUA的能力支持下,当遇到困难或犯了错误时,Operator会利用推理能力进行自我纠正或将控制权交还给用户。

  在安全和隐私方面,Operator执行任务时,人可以控制这个过程,而当用户输入支付信息等敏感信息时,Operator会要求用户接管,在这个过程中Operator不会收集用户输入的信息。据介绍,Operator也会拒绝一些有害的请求。未来OpenAI计划开放CUA的使用接口,使开发人员能用其构建自己的智能体。目前可使用Operator的用户群体还有限,ChatGPT Pro用户每月会员费达到200美元,Operator后续还计划向ChatGPT Plus、Team、企业用户开放使用。

  Operator发布后,OpenAI总裁兼联合创始人Greg Brockman(格雷格·布罗克曼)在社交媒体上表示,2025年是智能体之年。此前,OpenAI也已多次释放发力智能体的信号。

  在被问及接下来的模型更新情况时,OpenAI CEO山姆·奥尔特曼(Sam Altman)去年曾提到,接下来会有更好的模型,但他相信下一个重大突破将是智能体。本月初,山姆·奥尔特曼在一篇博客长文中表示,相信2025年人们将会看到第一批AI智能体“加入劳动力大军”,从根本上改变各公司产出的东西。当地时间1月14日,OpenAI还推出了名为Tasks的测试版新功能,用户可用其创建和管理未来任务提醒,该功能也具备一定的智能体属性。

  有研发人员告诉记者,智能体的关键在于AI模型具备更强的主动性。在国内,较早布局智能体企业是智谱AI。去年11月,智谱AI发布了PC端智能体GLM-PC并开始邀请测试,该智能体的功能也包括点外卖、发微信。该智能体近日发布了更新,推出“深度思考”模式并增加了专用来做逻辑推理和代码生成的功能。

  智谱华章总裁王绍兰去年12月表示,2025年AI领域有两个重要发展方向,其中一个就是智能体技术,也就是大模型使用工具,“现在手机APP还需要按照人的方式在操作,可以想象大模型能熟练使用工具对行业意味着什么。”

  (本文来自第一财经)

有话要说...