首页 > 传媒 > 关键词  > 电路模拟最新资讯  > 正文

依托鲲鹏处理器矩阵算力 中科大陈俊仕团队破解稀疏计算效率难题

2025-11-29 23:01 · 稿源: 站长之家用户

电路模拟的复杂推演到量子化学的微观分析,大规模稀疏线性方程组的高效求解是科学计算领域的核心需求。但传统稀疏直接求解器因数据非零元分布稀疏且不规则,导致运算低效、算力浪费等问题。近日,中国科学技术大学计算机科学与技术学院特任副研究员陈俊仕团队,在鲲鹏昇腾科教创新卓越中心的算力支持下,创新研发出面向鲲鹏处理器矩阵算力基于密集kernel的LU直接求解器,以密集运算方式实现了稀疏计算的高效求解,成功突破传统运算瓶颈。

该研究创新构建了一种面向稀疏矩阵计算的密集计算范式,系统化解构了传统稀疏直接求解器的性能瓶颈。团队通过将分散的非零元整合为更加规整的密集数据块,将不规则稀疏矩阵映射为统一稠密的大块结构,进而采用基于稠密矩阵运算的数值分解算法,取代传统稀疏运算中聚合非零小分块的碎片化计算模式,显著降低了由不规则内存访问引发的计算与调度开销,最终实现了计算效率与硬件利用率的协同优化。

该方案的顺利落地,深度依赖于鲲鹏平台的计算特性。硬件层面,鲲鹏920新型号集成专用矩阵运算单元,原生具备高密度数值分解运算的高效承载能力,可精准匹配密集数据块的集中化处理需求;其多核架构为大规模密集数据块的并行运算提供了坚实基础,避免算力闲置或过载。软件层面,鲲鹏 KML 数学库针对密集型矩阵运算进行深度优化,通过底层算法与硬件架构的协同,进一步放大了密集运算模式的性能潜力。经70余个跨领域测试集验证,该方案性能较SuperLU 求解器平均加速32.2倍,在基础硬件配置下实现了平均9.6倍性能加速,大幅压缩了科学计算的时间成本。

目前,相关研究成果已发表于 CCF B 类国际会议 Euro-Par2025,其核心技术已申请中国发明专利并获得授权。此次成果是鲲鹏平台在科学计算领域的典型实践,该方法对于现代高性能处理器上稀疏计算问题的高效求解、充分地发挥处理器上的矩阵运算单元具有很好的应用价值。未来,随着鲲鹏生态的持续完善,其在高性能计算领域的赋能作用将进一步凸显,助力更多科研团队突破技术难关,推动科研成果加速落地转化。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 物理AI革命爆发:邦彦技术如何卡位下一代商用计算机?

    文章指出,AI正从聊天机器人演变为理解并改变物理世界的强大力量。邦彦技术以“模型+数据=安全”为核心逻辑,通过构建从底层硬件到上层应用的完整AI计算生态,卡位未来技术制高点。其推出的邦彦云PC作为下一代计算入口,以及女娲AI数字人,致力于解决AI与物理世界交互的核心难题,并重新定义安全边界。文章认为,物理AI时代竞争的关键在于全栈能力,邦彦技术凭借前瞻布局,已在这场变革中占据有利位置。

  • 抢占空间计算 “门票”:万有引力芯片改写全球 XR 产业格局

    万有引力电子科技通过“分体式”设计,将MR眼镜重量从600多克降至90多克,彩色透视端到端延迟压至9毫秒以下,实现了当前市场90%以上XR产品的核心能力。其创始人王超昊博士强调,团队从用户体验出发,倒推产品指标,并采用开放架构的极智G-X100芯片,结合5nm制程与精密设计,打造出轻便如普通眼镜的参考设计。该方案还推出“极域”空间计算全栈平台,将复杂工程环节封装为即插即用模块,帮助合作伙伴将产品开发周期从18个月以上缩短至6个月左右,为行业提供量产加速器。

  • 别只会多穿衣了 科学保暖记住这四点

    ​随着冬季气温骤降,如何科学保暖成为公众关注的焦点。许多人认为多穿衣服就能抵御寒冷,但专家指出,做好重要关节和部位的防护同样关键。 专家建议,保暖可遵循“三层穿衣法”:内层选择吸湿排汗的材质,如棉或莫代尔,避免汗湿导致着凉;中间层注重保暖性,推荐羊毛或抓绒材质;外层则需防风防水。此外,合理使用护具能提升保暖效果,例如透气、弹性好的护膝、

  • 即构推出AI音视频能力矩阵 助力应用突围增长

    如今,移动应用市场竞争进入了存量博弈新阶段,应用内的新玩法复制成本低,单靠独创模式难以吸引用户留存。Sensor Tower数据显示,全球应用商店双寡头垄断格局稳固,头部应用占据超60%用户时长,中小应用突围愈发艰难。行业增长逻辑已转向内容质量与优质体验,音视频质量低下可能导致用户留存与转化显著下滑。尤其是在直播语聊、网课、电商、音视频创作工具等高频�

  • 算力赋能,打造生命科学云上新范式

    某生命科学研究院推出基于云架构、AI驱动的多组学在线分析平台,以技术与数据为核心,为科研工作者提供一站式分析服务。平台全面支持蛋白质结构预测、时空组学、单细胞与基因组数据分析等前沿科研,并贯通至精准医疗等产业化应用,覆盖生命科学研究的多元场景。该平台依托火山引擎提供的强大底层算力与存储支持,结合AMD实例构建高性能资源池,实现十万核级别的弹性调度效率,保障大规模并行计算任务高效稳定运行。通过智能冷热数据分层方案,存储成本降低30%以上,实现成本与效率的最优平衡。最终,平台充分释放其技术优势,为医学科研提供更高效、稳定、精准的全流程支撑。

  • 2026柴火饭电饭煲推荐指南:从加热逻辑到口感科学,选对一煲好米饭

    文章指出,2026年柴火饭电饭煲竞争核心已转向内胆结构、沸腾方式与多维加热系统的协同优化。当前主流技术路径集中在三点:通过球型内胆强化米水翻滚效率;通过底部强火与侧向、上盖复合加热模拟传统灶火包裹效果;通过程序算法控制沸腾节奏,使米粒充分糊化、释放自然甜感。基于此,文章结合产品结构、价格区间与用户口碑,推荐了十款值得关注的型号,并总结选购建议:追求明显口感升级的用户应优先选择具备旋流结构与双重加热体系的型号;更看重日常稳定与多功能使用的家庭,则可在中端价位中寻找平衡型产品。

  • 新一代SU7全系搭载小米超级电机V6s Plus:将实现自研自产

    新一代小米SU7近日已经公布,并且同步开启小订,标准版预售价是22.99万元,Pro版预售价是25.99万元,Max版预售价是30.99万元。 对比上代21.59万元的起售价,新一代小米SU7价格有所上涨,这主要由于配置全面提升,其中就包括电机。 根据工信部公布的新车信息,该机搭载的电机生产厂商有小米汽车科技有限公司。 官方今天正式宣布,新一代SU7将全系搭载小米超级电机V6s Plus,�

  • 未岚大 陆携五大新品矩阵,亮相2026国际消费电子展

    在2026年CES展上,中国品牌未岚大 陆以“Craft Every Yard With Navimow Standards”为主题,携五大新品矩阵亮相,首次系统化展示其重塑行业体验的“Navimow标准”。该标准通过免部署自动建图(Drop and Mow)与行业领先的“Xero-Turn™零转全驱、越障不伤草”系统,突破传统产品在安装复杂度与草坪保护方面的瓶颈,推动无边界智能割草机器人迈入以技术标准驱动的下一代发展阶段。五大�

  • 矩阵谋篇,布局山海:2025,看万达生活方式酒店的品牌交响曲

    2025年,万达生活方式酒店品牌(万达颐华、万达美华和万达悦华)通过“品牌交响乐”战略,在中国及海外市场实现协同扩张。其核心在于品牌矩阵的精准布局与协同作战,例如在北京中轴线,万达颐华以高雅文化吸引高净值客群,万达美华则以性价比和年轻化设计捕获年轻旅行者,形成互补合力。这种多品牌协同策略在乌鲁木齐、吉林滑雪度假区等地得到复制深化,展现了品牌对细分市场的卓越掌控力。文章指出,未来酒店竞争不再是单点项目的较量,而是品牌系统战略、文化解码能力与精准市场卡位协同作用的综合比拼。

  • 京东PLUS会员年度盛典:超级联名卡“买一得五”、最高领1345元超级补贴券

    京东PLUS会员年度盛典于1月7日晚开启,推出价值超千元的“超级联名卡”,限时298元抢购,可享腾讯视频VIP、网易云音乐等五大权益,并加赠5斤车厘子。会员还可领取最高1345元超级补贴,于1月8日叠加使用。此外,京东PLUS会员生活服务包新增汽车保养、洁牙等服务,积分可免费兑换。数据显示,2025年京东PLUS会员累计为用户节省近300亿元,超七成用户认为其“最省钱”。未来,京东PLUS会员将继续扩展权益,覆盖更多生活场景。

今日大家都在搜的词: