首页 > AI头条  > 正文

​Liquid AI 推出 STAR 模型架构,效率超越传统 Transformer

2024-12-03 14:29 · 来源: AIbase基地

在当前大型语言模型(LLM)开发的竞争中,各大人工智能公司面临着越来越多的挑战,因此,越来越多的目光开始转向 “Transformer” 以外的替代架构。Transformer 架构自2017年由谷歌研究人员提出以来,已成为当今生成式人工智能的基础。为了应对这一挑战,由麻省理工学院孵化的初创公司 Liquid AI 推出了一种名为 STAR(Synthesis of Tailored Architectures)的创新框架。

image.png

STAR 框架利用进化算法和数值编码系统,旨在自动化生成和优化人工智能模型架构。Liquid AI 的研究团队指出,STAR 的设计方法不同于传统架构设计,它采用了分层编码技术,称为 “STAR 基因组”,从而探索潜在架构的广泛设计空间。通过基因组的组合与变异,STAR 能够合成和优化符合特定性能和硬件需求的架构。

在针对自回归语言建模的测试中,STAR 显示出优于传统优化 Transformer++ 和混合模型的能力。在优化质量和缓存大小方面,STAR 进化的架构相较于混合模型的缓存大小减少了高达37%,而相较于传统 Transformer 则达到了90% 的减少。这种高效性并未牺牲模型的预测性能,反而在某些情况下超越了竞争对手。

研究还表明,STAR 的架构可扩展性强,一个从1.25亿参数扩展到10亿参数的 STAR 进化模型在标准基准测试中表现与现有的 Transformer++ 和混合模型相当或更好,同时显著降低了推理缓存需求。

Liquid AI 表示,STAR 的设计理念融入了动态系统、信号处理和数值线性代数的原理,构建了一个灵活的计算单元搜索空间。STAR 的一大特色在于其模块化设计,使得它能够在多个层次上编码和优化架构,为研究人员提供了洞察有效架构组件组合的机会。

Liquid AI 认为 STAR 的高效架构合成能力将应用于各种领域,尤其是在需要平衡质量与计算效率的场景。虽然 Liquid AI 尚未公布具体的商业部署或定价计划,但其研究成果标志着自动化架构设计领域的一次重大进步。随着 AI 领域的不断演进,像 STAR 这样的框架可能会在塑造下一代智能系统中发挥重要作用。

官方博客:https://www.liquid.ai/research/automated-architecture-synthesis-via-targeted-evolution

划重点:

🌟 Liquid AI 推出的 STAR 框架通过进化算法自动生成和优化 AI 模型架构。

📉 STAR 模型在缓存大小方面减少了高达90%,并在性能上超过传统 Transformer。

🔍 STAR 的模块化设计可应用于多个领域,推动 AI 系统优化的进一步发展。

  • 相关推荐
  • 星耀南山、创见未来,「X-Day」西丽湖路演社创业之星Next Star专场燃动科创热潮

    11月15日,“X-Day”西丽湖路演社在深圳大学城举办“创业之星”Next+Star百万奖金全球赛专场,联动政府、投资、金融等多方资源,构建资本对接桥梁,助力创新项目落地南山。活动汇聚6个硬核项目,覆盖AI、生物医药等领域,展现前沿产业活力。平台通过常态化路演与赛事联动,已促成超5.3亿元股权融资及2.34亿元银行授信,持续优化区域科创生态,彰显南山“鼓励创新、支持创业”的浓厚氛围。

  • AI日报:Meta开源可交互3D模型SAM 3D;联想将推出个人超级智能体;华纳音乐与 Udio 达成版权和解

    火山引擎在Gartner AI平台魔力象限中位列中国第一、全球第五,其模型-工具-算力-场景闭环优势显著。OpenAI为美国K-12教师推出免费ChatGPT工具,助力教学准备与AI技术应用。谷歌地图集成Gemini模型,新增行程规划、地标导航等AI功能。联想计划推出个人超级智能体,对AI发展持乐观态度。华纳音乐与Udio达成和解,将于2026年推出AI音乐创作平台。QQ浏览器升级AI小窗与语音朗读功能。Meta开源SAM 3D模型,可实现单图生成交互式3D资产。Prime Video推出AI视频回顾功能,自动生成剧集精华片段。

  • TME们的黄金时代,迎来AI终结者

    过去十年,中国与全球的音乐流媒体平台都在同一套逻辑下运行:依赖庞大的版权曲库、依赖订阅制、依赖“以版权为护城河”的内容供给方式,稳稳地坐在产业链的中心位置。 无论是 TME,还是网易云,平台之间的竞争从本质上都不是产品之争,而是版权之争——谁拥有更完整的曲库、谁能锁定更多独家资源,谁就拥有更牢固的用户粘性。 然而,随着AI音乐过去一年里爆发式

  • 颠覆Diffusion局限!Utopai双模型耦合架构,攻克AI影视长叙事核心难题

    Utopai Studios推出专为影视制作设计的AI模型与工作流,区别于主流视频生成模型,其核心能力在于理解剧本、规划镜头及生成场景,通过自回归模型负责叙事规划与一致性约束,扩散模型专注高质量画面渲染。该系统能解决跨镜头元素漂移难题,提升制作效率与作品品质。目前工作流仅用于公司自有项目,强调AI作为创作者协作者的角色,并遵循行业道德与版权规范。

  • 字节旗下AI编程工具TRAE SOLO发布 面向所有用户开放

    字节跳动AI编程工具TRAE SOLO正式版发布,面向国际用户开放。该工具提供IDE和SOLO两种开发模式:IDE模式在保留原有流程基础上增强智能问答、代码补全等AI能力;SOLO模式以AI为主导,能理解开发目标、调度工具并独立完成从需求分析到代码实现的全流程。这标志着AI编程从工具增强迈入流程重构新阶段,实现覆盖软件开发全流程的高度自动化。

  • 从“实时分账”到“智能问数”:汇付天下以“Data Agent”重塑支付业务决策效率

    汇付天下作为技术驱动的数字化企业,践行“数字化+国际化”战略,为全球企业提供支付、账户、资金管理及数据集成解决方案。面对海量交易数据处理需求,公司依托火山引擎技术,构建湖仓一体架构,实现毫秒级风控响应与实时分账,并通过Data Agent智能平台支持自然语言查询与业务归因,推动数据驱动运营。该方案以流批一体能力优化数据处理效率,保障业务稳定与合规,助力企业实现全域增长与智能化风控协同。

  • 华为Mate X7外观公布 搭载全新折叠玄武架构

    华为Mate X7折叠屏手机正式亮相,搭载全新超可靠折叠玄武架构,通过80℃热水喷淋、铁球冲击及弯折测试等极限可靠性检测,抗跌落、抗冲击及抗热水性能全面升级。支持IP58/IP59级别防尘抗水,典藏版外屏采用第二代玄武钢化昆仑玻璃,抗摔性能更出色。延续后置四摄与闪光灯布局,影像系统升级至5000万像素可变光圈主摄和潜望长焦镜头,硬件配置麒麟9030芯片,提供12GB/16GB/20GB多种内存版本,满足不同使用需求。

  • 科杰科技入选赛迪AI Infra平台市场研究报告,引领Data&AI数据基础设施新范式

    近日,赛迪顾问发布《2025中国AI Infra平台市场研究报告》,全面梳理中国AI基础设施平台市场格局、技术趋势与竞争态势。报告显示,2024年中国AI Infra平台市场规模达345亿元,预计2025年将飙升至673亿元,同比增长95.1%。企业AI应用正从单点验证迈向嵌入核心业务流的深度阶段,对基础设施提出更高要求。科杰科技凭借Data&AI融合架构、湖仓一体引擎及企业级AI落地能力强势入选,位列“挑战者”象限,彰显其在Data&AI领域的领先地位。

  • 影像灭霸 vivo X300 Ultra参数出炉:唯一全大底双2亿像素

    博主数码闲聊站爆料,vivo X300 Ultra采用全新的双2亿全大底三摄方案。 具体来说,该机配备2亿像素35mm超大底主摄、5000万像素1/1.28英寸超大底超广角以及2亿像素大底潜望长焦,组成全新的双2亿三摄全大底方案。 在上代旗舰X200 Ultra上,vivo就启用了超大底超广角

  • TabTab 登顶模力工场 AI 应用榜榜首, 把 AI 数据分析师装进口袋,关键结论更快抵达!

    TabTab是一款全链路AI数据分析助手,核心功能包括多源数据连接(支持文档、数据库、电商平台等)、自动化采集清洗、内置分析模型及可视化呈现。其优势在于通过多智能体系统实现自然语言交互,降低分析门槛,让非技术人员也能快速完成客户洞察、销售业绩等分析,显著提升效率。产品定位中立,致力于构建多元化AI效率提升生态。

今日大家都在搜的词: