首页 > AI头条  > 正文

彩云小梦V3.5上线!突破性提升Transformer效率

2024-11-14 18:01 · 来源: AIbase基地

彩云科技日前在北京举办"From Paper to App"主题沟通会,正式发布基于DCFormer架构的通用大模型"云锦天章",并宣布旗下AI RPG平台彩云小梦升级至基于DCFormer的V3. 5 版本。这标志着人工智能领域在模型架构效率方面取得重大突破。

在AI领域,Transformer架构一直是ChatGPT、Gemini等主流大模型的核心技术支撑。今年,彩云科技在国际顶级会议ICML上发表的论文《Improving Transformers with Dynamically Composable Multi-Head Attention》首次提出DCFormer架构。测试显示,基于该架构开发的DCPythia-6.9B模型在性能上实现了对传统Transformer模型1.7- 2 倍的显著提升。

对于AI发展面临的能源挑战,彩云科技CEO袁行远指出,根据预测,到 2050 年全球AI耗电量可能达到目前地球发电能力的 8 倍。英伟达CEO黄仁勋更形象地表示,按目前发展速度,未来可能需要" 14 个行星、 3 个星系、 4 个太阳"来为AI提供能源支持。

针对这一困境,彩云科技选择从改善模型底层架构入手。DCFormer通过引入可动态组合的多头注意力(DCMHA)机制,解除了传统多头注意力模块(MHA)中注意力头的固定绑定,实现了更灵活的动态组合,从而大幅提升模型表达能力。该创新使彩云科技在ICML会议上的三篇论文获得平均 7 分的高分,并成为国内仅有的两家受邀在维也纳ICML2024 登台演讲的企业之一。

作为DCFormer架构的首个落地产品,新版彩云小梦展现出卓越性能:支持 1 万字的长文本输入,故事背景设定长度可达 1 万字,整体流畅性和连贯性提升20%。这意味着AI能够更好地维持剧情连贯性,保持人物性格一致性,并具备情节反思和修正能力。

彩云科技作为国内最早涉足大语言模型的企业之一,目前已拥有彩云天气、彩云小梦、彩云小译三款盈利性AI产品。公司表示将继续加大对DCFormer的研发投入,致力于打破"国外技术层、国内应用层"的传统格局,推动国产AI技术在全球竞争中占据优势地位。

通过这次技术突破,彩云科技不仅展现了中国企业在AI底层架构创新方面的实力,更为解决AI发展中的能源瓶颈提供了新思路,有望加速AI技术的可持续发展。


  • 相关推荐
  • DeepSeek更新至V3.1 Terminus版本:两大升级

    9月22日,深度求索宣布DeepSeek V3.1已更新至Terminus版本,官方App、网页端、小程序与API模型同步升级。本次更新在保持模型原有能力基础上,针对用户反馈进行改进:优化语言一致性,缓解中英文混杂、异常字符等问题;提升Code Agent与Search Agent表现。官方表示新版本输出效果更稳定,各领域评测表现优异。开源版本已在Hugging Face和ModelScope平台发布。

  • 新一代AI存储大幅提升训练效率,断点恢复速度提升

    AI训练频繁中断是行业难题。华为OceanStor A系列存储通过TB级集群带宽和高速读写能力,显著优化断点续训性能。AI大模型集群部署该方案后,恢复时间从15分钟缩短至1分钟,保障GPU/NPU算力资源充分利用。华为强调,高性能存储正成为以“存”强“算”的关键基础架构。

  • 问界新M5 Ultra VS 小米YU7深度对比,多维解析智能SUV标杆

    在20-30万元新能源SUV市场,问界新M5 Ultra与小米YU7凭借突出的智能属性成为都市精英热门选择。两款车型均以辅助驾驶为核心卖点,但在硬件配置、软件算法及安全理念上存在差异。问界新M5 Ultra搭载三颗4D毫米波雷达和192线激光雷达,配合华为ADS系统,在感知精度和主动安全上更具优势;小米YU7采用单颗4D毫米波雷达和128线激光雷达,侧重被动防护。市场表现方面,问界新M5 Ultra销量稳步提升,叠加最高3.7万元购车权益,成为该价位段的优选车型。建议消费者实地试驾后结合需求理性决策。

  • 元旦前登场!小米17 Ultra配备2亿像素无损变焦+徕卡增距镜

    小米17系列上市后市场反响热烈,首销两天销量突破百万,成为国产旗舰中的佼佼者。目前三款机型只是开胃菜,真正的旗舰小米17+Ultra预计元旦前发布,影像能力大幅提升,配备2亿像素无损变焦和徕卡增距镜,实现全链路真光变,长焦体验升级。该机搭载高通骁龙8 Elite Gen5平台,配备6.85英寸LTPO OLED 2K屏,边框比iPhone更窄,支持无线快充、防水和大电池。此外,小米NAS将与新机同台发布,主打普及和生态联动,兼容苹果设备,优化相册管理、存储等功能体验。

  • 基于华为云Token服务的稿定AI上线,一站式解决设计难题

    在视觉时代,AI正重塑设计交付方式。9月19日,华为全联接大会期间,中国商业设计品牌“稿定设计”推出基于华为云Token服务的AI设计平台“稿定AI”,实现从创意激发到成品交付的一站式服务。该平台具备灵感采集、创意激发、视觉精修等能力,通过分层内容生成和无限画布功能,让设计更高效可控。依托华为云算力支持,稿定AI大幅提升多模态大模型生成速度,文生图提速2

  • 忆联首款消费级QLC SSD AE531重磅发布!以超强可靠性与广泛兼容性,强力打造用户极致TCO

    忆联近日推出首款消费级QLC SSD产品AE531,基于QLC NAND技术,具备卓越生态兼容性与全生命周期成本优化。产品采用新一代控制器与智能IO加速模块,实现高达6800/5600MB/s顺序读写速度,性能媲美TLC产品。通过超低延迟架构、动态资源调度与持久性能保障三大核心技术,显著提升混合读写效率。支持国密加密算法,适配多平台操作系统,单位容量成本较TLC下降30%,功耗低于2.5mW。历经7000+项严苛测试验证,平均无故障工作时间超200万小时,为消费级PC、笔记本电脑等终端提供高性价比存储解决方案。

  • 从价格混战到价值重塑——科龙静省电Ultra背后的行业转型思考

    2025年空调行业竞争加剧,价格战激烈、产品同质化严重,库存高达6000万套。科龙凭借41年技术积累,以“反内卷”思路推出静省电Ultra系列,通过美芝压缩机、双排7mm紫铜管等核心升级,APF值达6.26,结合AI节能技术再省电45%。产品定位2000-3000元主流区间,以“技术普惠”打破高能效必高价的认知,兼顾用户利益与社会责任,推动行业从价格竞争转向价值创造。

  • 明暗场景皆享超凡画质:2025款三星OLED产品实现突破性创新

    三星2025款OLED电视通过防眩光技术与AI伽马调节技术,显著提升观影体验。防眩光技术有效减少环境光干扰,反射率降低超25%;AI技术智能优化画面亮度和对比度,确保任何光照条件下都能呈现卓越画质。结合更高亮度、纯黑表现及165Hz刷新率,为影音与游戏用户提供极致沉浸体验,巩固了三星在OLED领域的领导地位。

  • 都市精英购车指南,问界新M5 Ultra对比小米YU7

    本文聚焦20-30万元区间新能源车市场竞争,通过对比问界新M5 Ultra与小米YU7,强调购车应关注实际体验而非参数堆砌。问界在感知硬件、辅助驾驶算法及主被动安全方面更具优势,搭载华为ADS系统,提供更精准可靠的智能出行体验。目前问界还提供高达3.7万元的购车权益,建议消费者亲身体验后再做选择。

  • 小米17 Ultra外观曝光:没有背屏 Pro版独占

    小米17系列新品爆料:Ultra版主打专业影像,无背屏设计;Pro系列独享定制化背屏,可同步打车、外卖等实时信息。小米总裁卢伟冰称背屏斥资10亿打造,友商难跟进。Ultra版升级三摄,采用大R角直屏、极窄边框,搭载骁龙8 Gen5平台,支持UWB技术,预计春节前发布。小米与徕卡合作深化,将通过光学、芯片、算法提升移动影像体验。

今日大家都在搜的词: