UFO是一个用于Windows操作系统交互的UI聚焦双Agent框架。它通过自然语言理解用户请求,并在一个或跨多个应用程序内无缝导航和操作来执行这些请求。该框架包含AppAgent和ActAgent两个agent。AppAgent负责根据用户请求选择应用程序。ActAgent负责在选定的应用程序内迭代执行操作,直到任务成功完成。两者都利用GPT-Vision的多模态功能来理解应用程序的UI并满足用户的请求。
点击前往UFO官网体验入口
需求人群:
"可用于让计算机代替用户操作Windows系统内的应用程序,提高工作效率,缩短任务时间。"
使用场景示例:
让UFO删除PowerPoint所有幻灯片的注释
用UFO从Word中提取文字,描述一张图片,写一封邮件并发送出去
用UFO在Excel表格中汇总数据
产品特色:
- 支持自然语言理解用户请求
- 可在一个或多个应用程序内操作
- 包含选择应用程序的AppAgent
- 包含在应用程序内执行操作的ActAgent
- 利用GPT-Vision理解应用程序UI
(举报)