首页 > 业界 > 关键词  > AI模型最新资讯  > 正文

让AI模型成为GTA五星玩家,基于视觉的可编程智能体Octopus来了

2023-11-10 13:46 · 稿源: 机器之心公众号

电子游戏已经成为如今现实世界的模拟舞台,展现出无限可能。以游戏《侠盗猎车手》(GTA)为例,在 GTA 的世界里,玩家可以以第一人称视角,在洛圣都(游戏虚拟城市)当中经历丰富多彩的生活。然而,既然人类玩家能够在洛圣都里尽情遨游完成若干任务,我们是否也能有一个 AI 视觉模型

......

本文由站长之家合作伙伴自媒体作者“机器之心公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • AI日报:快手推出AI视频制作助手Kwali;字节跳动推出USO模型;OpenAI推出ChatGPT开发者模式

    本文介绍了AI日报栏目,聚焦AI领域最新动态。快手推出Kwali视频助手,简化视频制作流程;字节跳动发布USO模型,解决图像生成中风格与主题的矛盾;微软推出Copilot Audio音频模式,提供个性化语音交互;Stability AI升级Stable Audio 2.5,支持高质量音频生成;阿联酋推出开源大模型K2 Think,拥有320亿参数;微信上线智能回复功能,提升公众号运营效率;OpenAI推出ChatGPT开发者模式,支持AI控制外部工具;字节跳动Seed团队发布AgentGym-RL框架,提升语言模型决策能力;月之暗面开源Checkpoint Engine中间件,优化LLM推理效率;B站开源IndexTTS-2.0文本转语音系统,支持情感与时长控制;Replit推出Agent 3编程助手,自主性提升10倍。

  • 性能超越GPT-4o及Qwen2.5-VL,百度超轻量小模型PP-OCRv5 Blog持续登顶Hugging Face热度第一

    百度发布超轻量级文字识别模型PP-OCRv5,仅0.07B参数却实现媲美700亿参数大模型的OCR精度。在多项测试中超越GPT-4o等通用视觉大模型,尤其在文本定位和边界框精度上表现优异。该模型支持5种文字类型识别,适用于教育、医疗、法律等多行业数字化需求,累计下载量超900万,是GitHub上唯一Star数超5万的中国OCR项目。

  • AI日报:小红书发布对话合成模型 FireRedTTS-2;百度文心新模型登顶Hugging Face榜首;xAI将裁员500人

    AI日报今日聚焦七大热点:小红书发布FireRedTTS-2语音合成模型,显著提升自然度;百度文心ERNIE-4.5登顶Hugging Face榜单;谷歌Gemini应用登顶美国免费榜;马斯克xAI裁员500人并战略转型;OpenAI拟大幅降低与微软分成比例;DeepMCPAgent开源框架提升AI代理生产力;蚂蚁发布AI开源全景图2.0;北京1400多所中小学推行人工智能通识课程。

  • AI日报:阿里云开源通义DeepResearch;夸克推医师考试大模型;迪士尼将起诉MiniMax

    本期AI日报聚焦多项前沿动态:阿里云开源轻量级AI代理DeepResearch,性能媲美OpenAI;夸克推出国内首个全阶段医师考试大模型测试集;微软Copilot将上线类ChatGPT记忆管理功能;迪士尼等巨头起诉MiniMax侵犯版权;OpenAI提升ChatGPT搜索准确性;Notion推出个性化AI助手;谷歌发布更小巧高效的时间序列预测模型TimesFM-2.5;Figma推出AI设计功能简化创作流程。整体展现AI技术在开源、医疗、版权、开发工具等领域的快速演进与应用创新。

  • Matrixport 加密基金获 FCA 营销许可,机构化投资通道加速成型

    2025年9月11日,Matrixport旗下旗舰产品Crypto Market Index Fund获得英国FCA营销许可,成为首个可在英国向专业投资者私募销售的瑞士加密基金。该基金追踪瑞士SIX交易所的CMI10指数,覆盖BTC、ETH等十大主流加密资产,采用合规基金结构,由FINMA监管。此次突破体现了Matrixport"双轮驱动"战略:持续优化产品结构与深化合规运营,为机构提供透明安全的数字资产配置工具。

  • 腾讯云TencentOS Server AI发布,为千行百业打造安全可靠的国产化数字底座

    腾讯云在2025全球数字生态大会上推出国内独家“OS+AI”解决方案TencentOS Server AI,旨在打造安全可靠的企业级服务器Linux操作系统。该系统通过AI技术优化算力调度与资源管理,显著提升大语言模型推理性能,在智能客服场景中吞吐性能提升超100%。同时支持GPU虚拟化与资源隔离,已帮助客户节约60%硬件成本。目前已在金融、政务等行业规模化应用,成为国产操作系统标杆。

  • AI日报:可灵AI发布数字人新功能;腾讯混元新技术给大模型 “去油”;抖音上线AI求真功能

    AI日报今日聚焦多项技术突破:可灵AI推出图片转视频功能,腾讯混元SRPO技术提升图像真实感,IBM开源文档处理模型Granite-Docling-258M。Meta发布带屏AI眼镜Ray-Ban,DeepSeek论文登《Nature》封面。OpenAI新增GPT-5思考时长调节功能,抖音上线“AI求真”辟谣工具,通用DeepResearch开源模型性能超越国际知名模型。

  • 行业迈向标准化!销售易Engage2025大会首发AI CRM评价模型

    2025年9月9日,腾讯旗下销售易在京举办第七届用户大会Engage2025。大会以“数驱增长 智赢未来”为主题,汇聚800余位来自世界500强、中国优秀出海企业、在华外资机构及各行业领军企业的高管与业务先锋,共议AI+CRM创新与企业数智化增长的前沿实践。腾讯集团副总裁、政企业务总裁、销售易董事长李强在开幕致辞中强调,CRM系统作为企业核心基础设施,是连接客户与战略的重要桥梁,更是推动持续增长的新引擎。会上,销售易携手中国信息通信研究院发布行业首个《面向企业用户的AI+CRM建设的评价模型课题共研成果》,填补了CRM智能化领域建设指导体系的空白,标志着国内CRM行业步入规范化发展的新阶段。

  • OpenAI发布GPT-5-Codex:可完成7小时单次编程任务

    OpenAI宣布推出新一代AI编程模型GPT-5-Codex,其最大亮点是创新的动态时间分配系统。 不同于传统AI追求秒级响应”,该模型可根据任务复杂度灵活调整处理时长,从数秒到7小时不等,以更接近人类专家的决策方式优化代码质量。 GPT-5-Codex产品负责人亚历山大恩比里科斯解释称,传统模型在任务初期即固定计算资源,而GPT-5-Codex能实时评估需求:动态决定加速推进、暂停语法核�

  • AI日报:AI内容新规正式生效;美团推出开源大模型LongCat;阶跃发布语音大模型Step-Audio 2 mini

    AI日报栏目每日更新AI领域热点内容,聚焦开发者需求。本期重点包括:阶跃星辰发布端到端语音大模型Step-Audio2 mini,在多项基准测试中表现优异;9月1日起AI生成内容需强制标识;美团推出开源大模型LongCat;上海AI实验室发布多模态大模型InternVL3.5;腾讯ARC团队推出音频生成模型AudioStory;OpenAI发布实时语音模型GPT-realtime;Meta与UCSD合作推出DeepConf技术;xAI代码库遭窃事件;阿里巴巴Qwen团队发布GUI自动化框架;微软推出Copilot Labs实验中心;小红书自动化工具xiaohongshu-mcp上线。

今日大家都在搜的词: