首页 > 业界 > 关键词  > 大模型最新资讯  > 正文

中科院和汪军团队发布 大模型玩星际争霸秀到起飞

2023-12-29 09:17 · 稿源:站长之家

要点:

1、中国科学院自动化研究所与伦敦大学学院合作,将最近兴起的LLMAgent技术应用于星际争霸II的AI研究。

2、团队通过LLM理解与分析能力来提高星际AI的长期战略规划与可解释性决策。

3、在测试中,LLMagent涌现出了超越AlphaStar的危险预测和兵种转型能力,以及前期快攻、前期侦察等类人策略。

站长之家(ChinaZ.com) 12月29日 消息:面对星际争霸II这一巨大挑战,团队开发了TextStarCraftII——一个全新的交互环境。TextStarCraftII基于python-sc2框架,将游戏中的状态信息和动作空间映射到文本空间。宏观战略动作被转化为LLMAgent能够理解并执行的具体语义动作,而微观操作则交由一套固定的规则式方法处理。LLMagent能够在全新的战场上与游戏内置的AI展开较量。

image.png

论文地址:https://arxiv.org/pdf/2312.11865.pdf

项目地址:https://github.com/histmeisah/Large-Language-Models-play-StarCraftII

在星际争霸II的战场上,进行有效决策需要及时处理大量复杂信息,进行合理的战略分析与长期规划,最终制定宏观战略决策。团队创新性地提出了「ChainofSummarization」方法。

该方法通过单帧总结和多帧总结,提高了LLM在复杂环境中的理解和决策能力。在验证ChainofSummarization方法的有效性方面,团队选择了GPT-3.5-turbo-16k作为LLM。结果表明:ChainofSummarization不仅将LLM与游戏端的交互速度提升了十倍,还显著增强了模型对游戏情境的理解及决策能力。

团队精心设计了一套复杂的提示词系统,包括游戏状态总结,状态分析,策略建议,最终决策。模型能够全面理解游戏的当前局势,分析敌我双方的策略,并提出具有战略深度的建议,最终做出多步的合理决策。这极大地提高了LLM的实时决策能力和长期规划能力,也极大提升了决策的可解释性。

举报

  • 相关推荐
  • 天地一体化创新突破!中科曙光与中科星图共建太空算网

    中科曙光与中科星图在"2025空天信息大会"达成合作,聚焦太空计算领域,计划创新"天地一体化"服务模式。双方将联合研发高性能、低功耗的专用核心部件,推动"芯片-整机-算网-数据-应用-生态"全链路技术创新,共建开放普惠的太空算网,构建"用户端-星上边缘-天基云-地基云"协同智能计算架构,实现算力互联调度与数据实时处理,并接入国家级算力服务平台,助力航天产业生态繁荣。此次合作响应国家培育商业航天等新兴产业需求,是落实科技自立自强的实践探索。

  • “晓妙”产业大模型——AI驱动的产业变革

    7月4日,安徽数智建材研究院在长城工程科技会议上发布"晓秒"产业大模型。该模型由傲林科技投资支持,采用"1+1+N"架构,融合数据、机理和业务模型,实现生产运营全流程实时闭环优化。中国建材集团董事长周育先表示,该模型已在水泥板块试点应用,吨水泥成本降低1%以上,能耗电耗下降2%以上。会议指出,AI落地制造业需突破三大关键:建立数字化体系、夯实数据基础、实现工艺与数据融合。未来将拓展至新能源、钢铁等十余个行业,推动产业智能化升级。

  • 国内有哪些ai大模型?一文看懂中国核心AI大模型全景

    近两年中国AI大模型发展迅猛,已形成"通用+行业"双轨并进的生态格局。百度文心一言、阿里通义千问等通用大模型在中文理解、多模态生成等方面表现突出;深度求索DeepSeek以1/10参数实现GPT-4级推理能力;月之暗面Kimi以20万汉字上下文窗口领跑长文本处理;智谱AI的GLM-4成为首个支持视频对话的国产千亿模型。医疗、金融等垂直领域涌现出百川智能等专业模型,覆盖超1000家医院。开源生态加速国产芯片适配,15家厂商完成深度优化。行业应用方面,工程文档效率提升60%,24小时拟人化客服等案例凸显价值。未来趋势呈现模型蒸馏、端侧部署和开源生态三大方向,中国AI正从实验室走向产业变革前沿。

  • 信通院联合三六零发布《大模型应用交付供应商总体能力要求》

    中国信通院联合360集团发布《大模型应用交付供应商总体能力要求》技术规范,从基础能力、大模型服务能力、行业实践能力和项目质量管理能力四个方面明确了大模型应用交付供应商的总体要求。该规范由20余家单位及40余位专家共同编制,旨在提升供应商技术、管理和服务能力,为行业提供供应商选择与评估参考。360作为国内大模型头部厂商,自主研发"360智脑"大模�

  • 实景直播秀新突破:11台FX3和FX6摄影机联合打造电影感时装直播秀

    文章讲述了新锐品牌Blacknini通过一场电影感大型直播秀传递品牌理念的案例。直播采用索尼FX6和FX3摄影机搭配原厂镜头,通过11个机位完成户外秀场和室内晚宴的拍摄。重点介绍了索尼设备在多机位协同、色彩匹配、散热稳定性等方面的优势,以及原厂镜头对焦精准、跟焦稳定的特点。文章还分享了现场调色方案和三种信号传输方式(光纤、微波图传和5G)的灵活组合,展现了�

  • 主流AI多模态大模型有哪些?超全的多模态大模型指南分享

    2024年多模态大模型成为AI领域最具前景的技术方向之一。文章全面分析了主流多模态大模型的特点、应用场景和发展趋势。多模态大模型能同时处理文本、图像、音频、视频等多种数据,实现更智能的人机交互。重点介绍了GPT-4V、Claude3.5、Gemini、通义千问等代表性模型,对比了它们在视觉理解、编程能力、中文处理等方面的优势。应用场景涵盖智能客服、内容创作、教育医疗等领域。未来发展趋势包括模型规模扩大、支持更多模态、实时交互能力提升等。选择模型需考虑应用需求、语言支持、性能成本等因素。

  • AI日报:xAI 震撼发布Grok4;微软开源全新Phi-4-mini版本;上海累计82款大模型通过备案

    AI日报栏目聚焦人工智能领域最新动态:1)xAI发布旗舰模型Grok4,在数学推理和代码生成表现突出,同时推出开发者专用Grok4Code;2)微软开源Phi-4-mini模型,推理效率提升10倍,适合边缘设备;3)上海82款大模型完成备案,垂直领域应用取得突破;4)Hugging Face推出开源桌面机器人Reachy Mini,支持Python编程;5)Perplexity发布AI浏览器Comet挑战Chrome;6)OpenAI将首次发布开放权重模型,打破闭源惯例;7)谷歌医疗AI模型MedGemma系列上新,单个GPU即可运行;8)OpenAI以约65亿美元收购AI硬件公司io Products,正式进军硬件市场。

  • 腾讯网易未成年人暑期限玩日历发布:一共可玩27小时

    近日,随着各地中小学陆续结束考试,学生群体正式开启暑假模式。为引导未成年人合理使用网络,腾讯游戏与网易游戏同步公布 2025 年暑期未成年人游戏时间管理方案,两家企业均采取严格时段限制措施。 根据新规,未成年玩家仅允许在每周五、周六、周日的 20 时至 21 时登录游戏,整个暑期累计游戏时长不超过 27 小时。这一时间框架较往年保持一致,通过技术手段对未成

  • 文生图大模型有哪些?探索AI绘画的核心引擎与选择利器

    本文探讨了当前主流的AI文生图技术及其应用场景。国际阵营中,OpenAI的DALL·E3擅长复杂语义理解,MidJourney以艺术风格见长,Stable Diffusion则以开源生态支持深度定制。中国力量方面,百度文心一格在中文语义和国风创作表现突出,阿里通义万相侧重商业化应用,昆仑万维天工支持长文本生成连贯图像。垂直领域工具如Adobe Firefly深度集成设计流程,Runway ML革新视频创作。文章建议通过聚合平台高效对比模型特性,并指出下一代技术将突破分辨率限制,实现跨模态生成。从精准语义到无限可能,AI文生图正在重塑视觉创作边界。

  • 男童玩绳套头意外变上吊:玩绳卡头险丧命

    近日,湖南一则儿童居家险情的监控视频引发网友热议。画面显示,一名男童在家中客厅玩耍时,将头部套入沙发扶手上的绳圈,不慎滑倒后身体悬空,呈现惊险的"上吊"姿态。所幸孩子爷爷就在不远处,第一时间发现险情并实施救援,避免了一场可能发生的悲剧。 据孩子家长介绍,事发时仅离开孩子视线片刻,没想到短短几分钟就发生意