「群体智能」剑指AGI革命！国产架构挑战Transformer霸权，非Attention模型更新

2024-09-30 10:31 · 稿源：站长之家用户

通往AGI先进之路，是什么?

这世界，没有一个完整的定义，也没有具体的答案。

此前曝出的OpenAI秘密路线图，将通往AGI目标划分五级。

而「草莓」o1 模型出世，代表着第二级已经实现。

李飞飞估值 10 亿美金独角兽World Labs，将「空间智能」看作通向AGI重要的桥梁。

他们计划打造出「大世界模型」(LWM)，通过对世界建模，让AI在3D世界中去感知、去生成、去互动。

国内一家AI初创团队，对此也有不同的看法。

他们认为，「群体智能」是迈向更广泛的通用人工智能的路线。未来，世界每个设备都拥有自己的智能，能够以类人的方式交互。

不过，实现这一想法的前提是，我们需要一个创新的算法架构。

值得一提的是，这个团队却做了一件「反直觉」的事——首创非Transformer独特路线。

基于全新架构，他们打造的Yan系列模型已经植入到树莓派、机器人、AIPC等终端设备中。

恰在RockAI开放日上，多模态模型Yan1. 3 全面升级，直接击败开源Llama 3，「真端侧」比较强大脑诞生了!

模型端到端，秒级实时人机交互

全新迭代后的Yan1.3，支持从文本、音频、视觉输入，并以语音、文本方式输出。

它模拟了人类复杂的感知系统，既能听懂自然语言、看懂视觉信息，也能通过语音方式表达。

可以说，它是全球头个人机交互领域中，端到端的多模态大模型。

凭借出色的架构设计，Yan1. 3 模型在兼容性和性能，取得了特出的表现，从低算力到高算力全面覆盖。

在不同终端上的体验，多模态Yan1. 3 更是实现了秒级实时响应。

在CPU上秒级响应，GPU上更是有百毫秒级的人机交互，体验非常丝滑赶超云端的大模型。

不如一起来看看，Yan1. 3 在手机、PC、机器人、无人机上，如何无损部署的。

低配 1500 元可跑，真·AI手机来了

在人手一台手机的时代，搭载一个本地的大模型，那才是真·AI手机。

现场演示中，离线部署Yan1.3 3B参数的手机，直接断网，上演了不用联网也能体验LLM的精彩一幕。

告诉语音助手RockAI自己的需求——介绍一下上海。它在遵循指令后，瞬间给出了关于上海的一些简单概要。

它还可以跨应用，完成系统的调用。

让它打开相册，并找出一张夕阳的照片。

RockAI不仅准确找到了夕阳照片，还给出了小红书的风格描述，这种费脑的事儿，它全部代劳了。

更惊艳的是，告诉它今天是小明生日，并帮自己为其送上祝福。

RockAI直接进入短信界面，自动生成编辑了一段内容，你所做的就是点击「发送」了。

可见，一个 30 亿参数离线模型，同时具备了以文找图、以图生文，Agent、语音助手等能力，强大到足以让人震撼。

在同等的手机硬件配置上，Yan1. 3 模型相比Transfomer有30%的性能超越。

或许有的人会问，能够运行这样的模型，一定需要高配的手机。

RockAI联创邹佳思称，从低端￥ 1500 到中端￥ 3000 配置，而且还只是8G运行内存，都可以无损适配。

懂人话有效助手，AI PC更便利

不仅如此，在个人PC上，业界早就掀起了AI PC的概念。

但若是没有在设备端完全部署模型，AI能力的使用会严重受限。而且，AI PC根本无法普及到大多数用户。

接下来，这段现场演示中，直接为AI PC掐断了网线。

上传一段主持人的天气预报音频，然后AI智能助手将其实时转录成了文字。

转写完成后，还能帮你立即总结出一份摘要。

另外，每个人办公时均会遇到一个困扰，「xxx图片」谁知道保存到了哪个文件夹。

现在，这个烦恼完全可以打消了。

只要一句话，AI智能助手就能直接帮你找到想要的那个图片。

而且，它还可以支持以图搜图的方式。

这些功能的实现，仅需要一台配备英特尔Core i5 主机即可流畅运行。

四步成诗，轻松拿捏新中式

Yan1. 3 还在人形机器人上，实现了离线运行。

我们都知道，构成机器人最核心的三要素，便是大脑、小脑、本体。

如果让一个冰冷的机械，同时具备「看听说想动」的能力，并基于已有的知识完成决策，最后指挥肢体进行行动。

这样的前提，一定是离不开大模型、分层控制算法的植入。

当你呼叫小苏小苏，你看见了什么?

凭借强大的多模态认知能力，它准确地描述出了当前周围的环境和布局。

另外，Yan1.3「大脑」控制的躯体，还能完成各类有效复杂的任务。

现场，让小苏吟诗一首——关于冬天的七言绝句，并在 4 步之内完成。

只见小苏一边走，一边完成了绝美的创作。

寒风凌冽雪纷飞，万物萧疏鸟自栖。唯有梅花凌雪放，清香四溢满庭芳。

有趣的是，当小苏吟诗后离拍摄者太近，让它让一让。

只见，憨态可掬的它向另一边慢慢踱步。

其实，在今年世界人工智能大会上，搭载Yan模型，基于树莓派打造的胖虎机器人就亮相了。

它在现场七步成诗、咏春拳法等各种精彩演示，吸引了一大波围观歪果仁观看。

城市巡检拍照，无人机全包了

而在无人机方面，搭载Yan1. 3 后的用法就更多了。

它不仅可以治安巡逻、交通巡检，异常监控，还可以当那个为你抓拍美照的「男友」。

当然了，智能巡检这类任务，对于一个城市管理来说非常重要。

植入离线模型的无人机，可以从多方位感知环境，快速识别图像信息，自适应调整飞行高度。

它可以搭配手机，完成「端」和「端」的互联操作。

交通巡检过程中，它可以智能识别违规车辆，并将信息传送到手机上。

当你自拍找不到满意角度，直呼「飞龙，给我拍一张氛围感满满的照片」。它一跃升天，拍下了多种角度的照片，通过对照片的多维度评分，还贴心地帮你选好了最美瞬间。

可见，全新升级的Yan1. 3 已经赋予了每个端侧设备「灵魂」。

它不仅在无人机、机器人、PC、手机等终端设备中，丝滑适配，而且模型智能能力迎来了全新升级。

无需阉割模型，让端侧设备具备了完整性、可持续性。

这种类人的输入输出过程，不仅大幅地提升人机交互的质量，还为未来教育、医疗等行业开辟了更广阔的应用场景。

当一个比较强端侧完成进化，那么一群比较强端侧协作，能够实现什么?

简言之，群体智能。

群体智能，怎么实现?

其实，群体智能，很早就存在于生物界。

蚁群会一起搬运食物、搭建蚁巢;蜜蜂会各司其职，协作维护蜂巢;狼群结队，捕获猎物等等。

这些都是，生物界群体智能的体现。

纵观生物界的发展，能够得出一个基本规律——个体智能化程度越高，群体智能的表现力越强。

就像人类一样，我们的群体智能，所表达出的文明程度远远高于蚁群、蜂群、狼群.......

从中汲取灵感，人工智能也会有「群体智能」。

单元大模型的智慧，能够反哺整个大模型群体，进而让AI群体更聪明、更智能。

或许你会说，其实国外很多研究，早就通过多个智能体协作，实现了高性能群体智能。

其实不然，它们之间有着本质的区别。

智能体本身，存在一个很大缺陷——不具备自主学习能力。

而且，智能体之间的协作，也是一个很小范围的协作。

究其根本，是因为基于Transformer架构大模型搭建的智能体，实现自我训练非常困难。

群体智能中最核心的要素便是个体，也就是「端」。

而基于Transformer架构的模型，若想在端上运行、并自主学习，根本不可行。

因为模型通常会被量化裁剪压缩之后，才会植入端设备。而被阉割之后的模型，就不再具备学习能力。

那该如何破解?

为了实现群体智能，RockAI经过多年的技术沉淀，创举了不同于Transformer的MCSD架构，并且提出了「类脑激活」机制。

这条路线，与OpenAI、World Labs有着本质区别，是国产公司在AGI前沿另辟蹊径的尝试。

Transformer不是仅有路径

当前的现状是，大模型领域早已呈现出Transformer「一家独大」的格局。

用AI大神Karpathy的话说:先进的GenAI模型，要么是自回归训练，要么是扩散训练，底层的神经网络通常都是Transformer架构。

虽然Transformer自身有许多优秀的特质，但不可否认，这仍不是一个百分百美好的架构。

甚至，有很多业界AI大佬已经看到了其中的巨大弊端。

首当其冲的，就是被诟病已久的幻觉问题。

Yann LeCun认为，LLM的幻觉根源于当前所使用的自回归Transformer架构。

「幻觉问题是自回归LLM架构特有的」「自回归LLM会产生幻觉…幻觉是自回归生成的本质缺陷」

这种架构上的本质缺陷，注定了有一天我们要走出Transformer生态，就像曾经 90 年代末走出SVM生态、 3 年前走出BERT生态一样。

就连提出Transformer核心架构作者之一Aidan Gomez认为，这世间需要比Transformer更好的东西，希望将其取代，把我们带向更高的性能高地。

「现在使用了太多计算资源，做了很多浪费的计算」

部署方面，基于Transformer架构模型对终端设备运行内存、储存空间提出了更高要求，同时压缩后的模型，在实际推理上大打折扣。

能源方面，今年 3 月，马斯克表示， 2025 年AI将耗尽电力和变压器，用他的话来说，「很讽刺的是，我们需要transformers(变压器)来运行transformers(模型)。」

很明显，无论是从减少幻觉、推动技术进步的角度，还是从环境保护、促进GenAI发展可持续的角度，我们都急需一种能够跳出Transformer「思维圈」的新架构诞生。

国内头个非Attention机制

RockAI初次提出的MCSD(Multi-Channel Slope and Decay)架构就是跳出Transformer路线的一次较好尝试。

而MCSD比较大的特点，便是替换了Transformer架构中的注意力机制。

随着序列长度的增加，Transformer架构对计算资源的消耗呈现O(N^2)增长，相比之下，MCSD实现了线性扩展，而且推理速度更快，将空间和时间复杂度分别降低到了O(1)和O(N)。

直白讲，MCSD全新架构能够将算力消耗降至更低。

也就意味着，基于此架构打造的模型，在端侧设备上运行有了新的可能。

论文地址:https://arxiv.org/abs/2406.12230

MCSD的具体架构如图 1 所示，由嵌入层和N个相同的组合层堆叠而成，每个组合层中由两个残差连接分别封装MCSD块和门控MLP块，两者都前置一个RMS归一化模块，并使用GeLU作为激活函数。

MCSD块的内部结构如图1(右)所示，集成了slope部分和decay部分，分别通过不同的预定义矩阵捕捉局部和全局特征。

两个部分均采用了双分支设计，一个分支负责进行线性投影，另一个通过聚合前面token的上下文信息来提取多通道历史特征，之后两个分支进行扰动(perturbation)操作。

slope和decay部分主要存在两方面的区别，一是预定义权重不同，因此在提取历史信息时对上下文的感知能力不同，前者更注重短程上下文，后者则更关注全局上下文。

将slope和decay两部分的输出进行拼接后就得到了MCSD块的输出，这两者的组合使得模型既能关注到距离更近的历史信息，也不会丢失更远的长距离上下文，从而同时增强了局部和全局的特征提取。

此外，论文还提出通过递归形式简化推理计算，将推理所用的空间和时间复杂度分别降低至O(1)和O(N)，显著压缩了所需算力。

实验数据显示，随着序列逐步变长，KV缓存的存在让Transformer推理的内存成本呈线性增加;相比之下，即使是8k的长序列，MCSD消耗的GPU内存也几乎不变。

给定序列长度后，随着批大小的增加，Transformer的延迟也会显著增加，而MCSD的延迟则依旧十分稳定。

此外，有相同批大小或序列长度时，MCSD的吞吐量性能也远远好于Transformer架构。

除了大大节约吞吐量、延迟、内存消耗等方面的成本，MCSD还在基准测试上有更佳的性能。

类脑激活机制

基于MCSD架构，RockAI实现了能在「端侧」运行群体智能单元大模型。

但这并不代表着，能够在更多端侧上实现特出性能。

因此，RockAI还在Yan系列模型中采用了创举的「类脑激活」机制，实现基于仿生神经元驱动的选择算法。

在主流的神经网络中，每次推理都需要激活全部神经元，这会导致大量算力浪费。

而人脑的运作并非如此。

不同的大脑区域负责不同的认知功能，因此不同的执行不同的任务只会造成一部分脑神经元的激活，而且激活的区域也各有不同。

比如开车时，视觉皮层会更加活跃;而写作时，掌管记忆或逻辑的脑区激活程度更高。这也许就是为什么，相比调动每个处理单元的计算机，大脑明显更加「节能」。

因此，模拟大脑中的神经元激活模式，可以让神经网络更加有效地处理复杂数据和任务，从而显著提升计算效率和精度。

通过以上两种方式结合，一是用MCSD替换注意力机制，而是通过选择性神经元计算，带了较好的低算力消耗。

正是基于如此强大的「双机制」，RockAI在今年 1 月发布了国内头个非Transformer架构的大模型Yan 1.0。

随之 7 月，发布了国内头个终端多模态大模型Yan 1.2。

经过几次迭代，目前已经升级为端到端的多模态Yan 1.3，代表着迈向群体智能的新起点，是群体智能的单元大模型。

厚积薄发，先进目标迈向群体智能

要实现AI的群体智能，并不是一件简单的事，提出MCSD架构和「类脑激活」机制，只是一个开始。

为了达到群体智能，RockAI将这个大目标分解为 4 个阶段的子目标，一步步稳扎稳打。

目前，他们已经跨越了首先级，正在完成第二级的跃升。

创新基础架构，是要跳出Transformer的既定路线，旨在实现模型性能效率的跨越式发展;

多元化硬件生态，则是模型部署落地的根本保证，只有适配多终端、多厂商、多型号的硬件，形成成熟的生态，才能为群体智能创造实现条件。

随着Yan 1. 3 模型的发布和广泛部署适配，意味着前两个阶段的目标已经基本实现。

从Yan 1. 0 到Yan 1.3，不仅覆盖了更多设备，还实现了端到端的多模态支持。

输入输出形式包含了文本、语音、视觉在内的多模态，不但大大方便人机交互，还能让多个AI模型之间更灵活地交流同步。

下一步，RockAI将继续发布Yan2.0，继续强化模型的自主学习、自我优化能力，让AI更好地和真实的物理世界交互。

在Yan系列智慧生态的基础上，持续的群体进化将成为可能，最终绘制出「群体智能」的未来蓝图。

（推广）

特别声明：以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布，本平台仅提供信息存储服务，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任，相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时，可及时向站长之家提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明（点击查看反馈联系地址）。本网站在收到上述法律文件后，将会依法依规核实信息，沟通删除相关内容或断开相关链接。

相关推荐

关键词：

迎“人工智能+”政策东风！2025中国智能产业大会&吴文俊人工智能创新大会即将落地常州

在全球AI竞争加剧背景下，国务院印发《关于深入实施“人工智能+”行动的意见》，推动AI与经济社会深度融合。中国人工智能学会主办的“2025第十四届中国智能产业大会暨吴文俊人工智能创新大会”将于8月30-31日在常州举行，聚焦破解AI产业“卡脖子”难题。大会设置15场专题会议和3场特色活动，覆盖基础技术突破、核心应用落地、交叉学科融合等领域，为产学研各界搭建高

人工智能政策利好产业大会
北电数智亮相世界人工智能大会，“四链融合”推动AI产业落地

2025世界人工智能大会“人工智能+”战略领军人才与创新发展论坛圆满落幕。论坛聚焦“人才领航智启未来”主题，汇聚中科院、社科院专家及中国联通、腾讯云等机构代表，围绕“人工智能+”行动分享经验，为AI高质量发展筑牢人才根基、激发创新动能。北电数智CMO杨震出席并发表演讲，分享AI行业落地实践，强调紧跟国家战略，推进产业、创新、人才、资本四链融合，打造面向不同场景的AI解决方案，全方位助力AI产业发展。

人工智能人才领军创新发展
海尔冰箱唯一获批“制冷家电人工智能技术山东省工程研究中心”

海尔冰箱在人工智能领域取得新突破，主导建设的"制冷家电人工智能技术山东省工程研究中心"成为2025年山东省工程研究中心认定名单中唯一入选的冰箱品牌。该中心聚焦人工智能、物联网、大数据等技术方向，开发了全空间智慧保鲜舱冰箱等140多项行业首创产品，近三年获授权发明专利803件。海尔冰箱还推出行业首款接入DeepSeek的AI全空间保鲜冰箱，具备方言识别、降噪技术等功能，显著提升用户体验。市场数据显示，2023年1-7月海尔冰箱以47%市场份额稳居行业第一。通过AI技术赋能，海尔冰箱正引领行业向精准、智能保鲜时代跨越。

人工智能海尔冰箱科技创新
微算法科技(NASDAQ：MLGO)基于人工智能优化构建混合ARIMA模型，提高比特币价格预测准确性

随着数字资产市场兴起，比特币等加密货币价格预测成为焦点。传统模型难以准确捕捉其非线性波动，微算法科技引入AI技术优化ARIMA模型，结合LSTM网络构建混合模型，提升预测准确性。通过AI算法自动处理数据缺失、异常值检测及参数优化，实现更可靠的比特币价格预测，为投资者提供决策支持。

比特币价格预测混合ARIMA-LSTM模型数字资产市场
下一个爆款在哪儿？2025英特尔人工智能创新应用大赛获奖名单揭晓

8月16日，2025英特尔人工智能创新应用大赛总决赛在深圳落幕。40支优秀团队从2817支队伍中脱颖而出，围绕工业、教育、心理健康、游戏等领域展开对决。大赛展示了AI从云端走向边缘的趋势，依托酷睿Ultra处理器和低代码开发工具，推动AI应用本地化落地。获奖作品包括动力电池机器人协作拆卸系统和AI生成PPT服务，体现AI与产业需求的深度融合。英特尔与联想、惠普等合作伙伴共同为开发者提供全栈支持，加速AI技术普及和商业化进程。

人工智能创新应用大赛
飞渡科技再度登顶数字孪生平台市场，空间智能引领产业变革新浪潮

IDC报告显示，飞渡科技以25.1%的市场份额蝉联中国数字孪生平台市场第一。其自主研发的DTS数字孪生平台集成多源数据治理、实时渲染与AI仿真等关键技术，实现全技术链覆盖，广泛应用于智慧城市、工业制造等领域。公司通过空间智能技术突破，推动数字孪生向“可知、可智、可决”演进，标志着行业进入以空间智能为核心驱动的新阶段。

数字孪生市场份额飞渡科技
飞渡科技以25.1%的市场份额蝉联数字孪生平台榜首引领空间智能新浪潮

IDC最新报告显示，飞渡科技凭借25.1%的市场份额蝉联中国数字孪生平台首位。其自主研发的DTS平台融合空间智能技术，突破行业瓶颈，在智慧城市、工业制造、水利水务等领域实现深度应用。报告指出，数字孪生市场正经历技术融合创新，飞渡科技通过垂直深耕战略，推动产业数字化升级。未来将持续加大AI融合研发，助力千行百业实现数字化转型。

数字孪生市场份额飞渡科技
ISC.AI 2025 人工智能安全治理与创新实践论坛圆满召开

ISC.AI2025人工智能安全论坛在北京召开，聚焦AI安全治理与创新实践。论坛汇集顶尖专家，探讨大模型安全评估与防护、智能体安全、AI治理等前沿议题。360集团张向征指出，随着Agent技术爆发式应用，AI安全已成为产业核心焦点。专家们强调需构建AI安全防护体系，应对大模型直接访问核心系统带来的全新挑战。中国电子院彭健提出企业合规建设需关注九大要素，清华大学苏航揭示智能体安全风险远超传统AI。华为云范建军倡导端到端大模型安全防护，中国信通院杨哲超呼吁构建协同治理框架。论坛为构建安全、普惠、负责任的人工智能未来贡献智慧。

人工智能安全大模型安全 AI治理
智元机器人姚卯青：以世界模型驱动飞轮，解锁具身智能规模化应用

智元机器人合伙人在2025世界机器人大会上发表演讲，系统阐述了公司在具身智能领域的探索成果与未来方向。公司已发布多款机器人产品，建成规模化生产线与训练场，并在算法领域实现多项创新。为解决数据难题，智元开源了AgiBot World百万真机数据集，并推出具身智能基座模型GO-1，该模型在三大场景测试中表现优异。公司创新性地提出"本体-数据-模型-场景"全栈布局理念，通过飞轮迭代逻辑加速技术突破。智元还推出GE Bench评测工具，并计划下半年发布新一代机器人AgiBot G2。过去一年，智元已在柔性制造、物流分拣等多个场景取得突破性应用成果。

世界机器人大会具身智能智元机器人
九四智能大模型联络中心：重塑教育行业运营逻辑

文章分析了教培行业面临的获客成本高、人工客服效率低、用户画像不清晰等痛点，指出九四智能通过AI交互引擎提供全场景智能运营服务，覆盖获客、用户运营、业务通知等环节，结合语音识别、大数据分析等技术实现降本增效，并通过典型案例展示了实际应用效果。

教培行业 AI交互引擎降本增效

「群体智能」剑指AGI革命！国产架构挑战Transformer霸权，非Attention模型更新

迎“人工智能+”政策东风！2025中国智能产业大会&吴文俊人工智能创新大会即将落地常州

北电数智亮相世界人工智能大会，“四链融合”推动AI产业落地

海尔冰箱唯一获批“制冷家电人工智能技术山东省工程研究中心”

微算法科技(NASDAQ：MLGO)基于人工智能优化构建混合ARIMA模型，提高比特币价格预测准确性

下一个爆款在哪儿？2025英特尔人工智能创新应用大赛获奖名单揭晓

飞渡科技再度登顶数字孪生平台市场，空间智能引领产业变革新浪潮

飞渡科技以25.1%的市场份额蝉联数字孪生平台榜首引领空间智能新浪潮

ISC.AI 2025 人工智能安全治理与创新实践论坛圆满召开

智元机器人姚卯青：以世界模型驱动飞轮，解锁具身智能规模化应用

九四智能大模型联络中心：重塑教育行业运营逻辑

今日大家都在搜的词：

热文

首发iPhone 17系列！苹果Apple Store官方旗舰店入驻抖音商城

华为MatePad Mini官宣9月4日发布

2025民营企业500强揭晓：京东第一

SpaceX第10次试飞成功马斯克：星舰这次没有空中爆炸

小米澎湃OS3发布会官宣首批Beta版招募机型公布

今日七夕节微信 520 元大额红包限时上线

AI日报：字节视频模型Waver 1.0发布；百度AI搜索APP“梯子AI”

AI日报：字节OmniHuman-1.5发布；PixVerse V5模型上线；腾讯

realme真我15000mAh电池容量手机亮相

iPhone17标准版或上高刷苹果2025秋季发布会定档9月10日

华为三折叠屏手机Mate XTs非凡大师上架开启预约

站长商机