首页 > 传媒 > 关键词  > 大模型最新资讯  > 正文

RockAI国内首个「非Transformer架构大模型」Yan通过网信办备案

2024-12-04 15:30 · 稿源: 站长之家用户

近日,上海岩芯数智人工智能科技有限公司(以下简称RockAI)的Yan架构大模型成功通过《生成式人工智能服务管理暂行办法》备案,这是国内头个非Transformer架构大模型通过备案。

Yan模型简介

Yan架构大模型是国内头个非Transformer架构、非Attention机制的大模型。传统的Transformer架构和Attention机制对算力要求较高,而Yan架构大模型以MCSD、类脑激活机制为基础原理,大幅提升模型性能与效率,以3B参数量可达到Llama3 8B的水平,还可在CPU上运行部署。MCSD架构具有快速训练、推理能力,实现更有效的特征提取,类脑激活机制则模拟大脑中的神经元激活模式,在计算时选择性激活部分参数,减少算力冗余,更有效地解决问题。Yan架构大模型在保证性能的同时,有效降低了对算力的依赖。这不仅有助于提高模型的运行效率,还能降低成本,为更多企业和开发者提供了触手可及的AI解决方案。

备案通过的价值

因此,Yan架构大模型通过备案对于RockAI以及行业发展均具有重要价值。

· 为行业发展开辟新的技术路径

作为国内头个非Transformer架构、非Attention机制大模型完成网信办备案,为行业发展开辟了新的技术路径。

· 证明非Transformer技术路线的潜力

证明在算力受限的情况下,非Transformer架构技术路线的可行性和潜力,从而能够鼓励更多企业探索多元化的技术发展方向。

· 业内仅有一家同时拥有双机制模型

RockAI成为仅有一家非Attention机制大模型和Attention机制大模型均备案通过的厂商,彰显了其在AI技术研发方面的创新能力。

Yan落地情况

技术突破之外,商业落地层面Yan架构大模型也取得了显著成果。依托低算力要求、本地部署、无损运行等优势,RockAI已与机器人、无人机、手机、电脑等领域的设备厂商建立深度合作,并在上述领域落地多个项目。

RockAI在大模型领域以“群体智能”的理念构建通用人工智能技术,以“让世界上每一台设备拥有自己的智能”为使命,致力于打造群体智能单元大模型,实现AI普惠。Yan架构大模型的备案通过是RockAI践行使命的重要里程碑,未来,我们期待Yan架构大模型在更多设备单元部署应用,让群体智能引领走向通用人工智能,与合作伙伴一起,领先一步开拓更加广阔的市场空间。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 突破算力限制!Meta开源“记忆层”,重塑Transformer架构大模型

    今天凌晨3点,全球社交巨头Meta分享了一个创新研究——Memorylayers。Transformer架构的预训练大模型在存储、查询数据时,随着参数的变大对算力的需求呈指数级增长。这样的设计既简化了维护流程,又提高了系统的灵活性和适应性。

  • 激进架构,400万上下文,彻底开源:MiniMax-01有点“Transformer时刻”的味道了

    “MoE”加上“前所未有大规模投入生产环境的LightningAttention”,再加上“从框架到CUDA层面的如软件和工程重构”,会得到什么?一个追平了顶级模型能力、且把上下文长度提升到400万token级别的新模型。这显然是巨大的野心,但在如今人们都在关注大模型接下来往哪儿走的时候,非常需要这样的野心,非常需要一个或者更多个“Transformer时刻”——在一个自己相信的路线上做到极致,把看似所有人都知道的配方,最终兑现出来,展示给技术社区里的人们,让它变成某个决定性的时刻,给AI的前进再添把火。

  • RockAI成功入选中国信通院华东分院大模型“图谱”

    由上海市经信委指导,中国信通院、临港集团主办的2025中国信通院深度观察报告会华东分会场在漕河泾举办,会上正式发布《2024大模型价值新视界:场景落地应用全景洞察图谱》。RockAI凭借Yan架构大模型在机器人、手机、PC等终端设备落地应用的探索,成功上榜图谱「具身智能」和「智能终端」两大领域。RockAI秉持“让世界上每一台设备拥有自己的智能”的品牌使命,深耕大模型领域技术突破,不断拓展多元设备端的落地应用场景,有助于推动大模型产业与硬件厂商的协同发展,促进智能化设备的AI升级,为实现AI普惠贡献力量。

  • •中国大模型公司提出新架构,解决Context无限长问题,开启Agent时代

    日月开新元,万象启新篇。1月15日,MiniMax发布并开源新一代01系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。受益于LinearAttention层面的架构创新、算力层面的优化,以及集群上的训推一体的设计,MiniMax以业内极具性价比的价格提供文本模型和多模态理解模型的API服务,标准定价是输入token1元/百万token,输出token8元/百万token。

  • FinPros富诺携手Trading Central,开启金融服务创新发展新范式

    在2024年11月底和12月初于青岛举办的全球三对三足球冠军赛上,Finpros富诺集团旗下富诺企业服务作为活动的官方顾问单位,助力活动圆满举行,为球迷带来一场足球盛宴,并邀请足球巨星参加公益活动,获得广泛认可。全球三对三足球冠军赛是重要的文化交流平台。FinPros富诺集团将继续以开放的视野和务实的行动,与合作伙伴共创美好明天。

  • 超越ControlNet++!腾讯优图提出动态条件选择新架构

    超越ControlNet,让文生图更可控的新框架来了!腾讯优图、南洋理工、浙大等研究机构联合推出DynamicControl,直接将多模态大语言模型的推理能力集成到文本生成图像)任务中。且还提出了一种新颖、高效的多控制适配器,可以自适应地选择不同的条件,从实现动态多控制对齐。这为可控视觉生成提供了新的视角。

  • 业内首个!京东发布“AI京医”大模型:准确率达99.5%

    快科技1月11日消息,2025京东健康年度医生盛典和数智医疗大会今天在京举行,京东健康发布了基于其线上全域场景的大模型全系产品AI京医”。AI京医”大模型包括一系列产品,包括AI诊疗助手2.0,AI科研助手、AI医生智能体等。2024年初,京东健康发布AI诊疗助手1.0版本,迅速成为医生群体使用率最高的智能辅诊平台。此次全新升级版的AI诊疗助手2.0,融合前沿AI技术及大数据分析技术,为医生提供更加精准、全面的诊疗建议和支持,降低医疗风险和误诊率。官方介绍称,目前,AI诊疗助手2.0”的分诊准确率达到99.5%,电子病历书写效率提升120%,AI

  • 大模型不再有信仰

    AI大模型的“AGI信仰”可能正处在崩溃边缘,与曾经的“区块链信仰”殊途同归。只是当初那一大批“区块链信仰者”,虽然绝大多数是韭菜,但也有一小批“塔尖”人士赚的盆满钵满;如今的AI大模型初创公司,抛开“AGI信仰”,恐怕连能活多久都不知道。2025年各大模型公司应该会更加务实是那句话,只有活得下去才有实现目标的可能,“信仰”不再重要。

  • 天娱数科大模型备案“再落一子”,数字化、智能化、全球化 “棋局” 同进

    国家网信办发布最新一批生成式人工智能服务备案公告,天娱数科自研基座大模型“天星”已于2024年12月20日成功通过辽宁省第一批大模型备案。天娱数科已有基座大模型天星大模型以及面向3D智能领域的行业大模型“智者千问”两款大模型通过备案。凭借深厚的技术积累与创新能力,为不同行业客户的数字化转型与智能化升级注入强大动力。

  • 小红书AI翻译加急上线,友评论区玩起Prompt,背后大模型和代码被扒出

    网友盛赞“最有用的大模型应用”,小红书AI翻译功能上线了!一整个实测发现,实在是太好用了。翻译软件做到的它能做,翻译软件不能做的它也能做。小红书AI翻译演艺大赏暂时分享到这里,你有挖掘到什么有意思的玩法吗?欢迎在评论区分享。