首页 > 业界 > 关键词  > SpaceHinting最新资讯  > 正文

User-Space Hinting将助力AMD霄龙处理器实现更好的任务性能发挥

2022-09-13 10:45 · 稿源: cnbeta

赶在下周于爱尔兰都柏林举办的 Linux Plumbers Conference 会议之前,AMD 还计划研讨如何改进“拆分末级缓存”(LLC)架构的调度程序。作为 AMD Linux 服务器团队的一名工程师,K. Prateek Nayak 刚刚发布了一系列补丁,并且专注于用户空间提示(User-Space Hinting)的任务放置计数。

Phoronix 指出:最新工作进展表明 AMD 打算改进 Linux 内核调度程序,并将之用于 LLC CPU 项目、以期改进该公司的 EPYC(霄龙)服务器处理器。

由 Linux 内核公告邮件列表(LKML)上的标记可知,新补丁仍处于“实验性”和“意见征求”阶段。

当前的 API 设计,只能设置较为低级的提示,且并未面向公众提供 —— 仅用于测试和演示 User-Space Hinting 在应用程序调度方案 / 最佳放置决策方面的功效。

若调度程序认为遵循提示将使系统处于次优状态,则可自由地忽略用户空间提示。

作为对比,当今调度程序使用的启发式方法 —— 例如 WF-SYNC 标记、wake_wide()逻辑等 —— 仍存在无法准确推断工作负载的性质的短板。

换言之,调度程序不明白是否最好将一组线程合并、还是拆分开来。由于无法推断工作负载的性质,或导致一系列不准确的放置决策,进而对工作负载的性能造成不利影响。

对于具有拆分 LLC 的系统(例如 AMD EPYC 霄龙服务器平台),其负面影响会被严重放大。

好消息是,该系列新补丁包括了在本地组中存在非活动核心时、选择父级附近的任务放置的功能。该过程负责决定继续使用包含最少利用率的组来扩展工作负载,并检查其它可能的提示。

其实早在去年,英特尔 Linux 内核团队的工程师 Peter Zijlstra,也曾介绍过一个高级提示框架。

其旨在帮助内核调度程序的任务序列能够应对日益复杂的 CPU 和工作负载,而当前状态下的 User-Space Hinting 则是通过 prctl() 接口完成的。

最后,英特尔 Xeon Ice Lake 平台上的初步测试结果表明,EPYC 服务器有望在 Hackbench、Schbench、Tbench 等各类工作负载上迎来性能的有效改进。

不过由于该系列补丁仍处于实验阶段,推测最终用户需要等待数月,才会看到它已做好被添加至 Linux 内核中的准备。

举报

  • 相关推荐
  • SpaceX回应星舰爆炸:无人员伤亡及周边危害

    昨日上午,SpaceX 36号星舰准备进行静态点火测试前,在西斯基地原地爆炸。 现场画面显示,星舰树立在发射架上,然而突然之间中上部就开始涌出白色烟,并立即发生爆炸。 爆炸剧烈异常,甚至有蘑菇云产生,以星舰为中心的建筑也受到波及,损毁严重。 今日,SpaceX发布星舰例行静态点火测试时发生爆炸的有关声明,声明指出未报告有人受伤,所有人员安全并已确认到位�

  • DigitalOcean 携手 AMD 推出 AMD Instinct MI300X GPU Droplet,加速 AI 创新

    DigitalOcean与AMD达成合作,将推出搭载AMD Instinct MI300X GPU的云服务器,支持AI/ML/HPC工作负载。该GPU具备192GB HBM3内存,能完整加载数十亿参数模型,显著提升训练和推理效率。服务定价每小时1.99美元起,支持1-8个GPU配置,并与Kubernetes无缝集成。未来还将推出MI325X GPU,并面向中国市场提供服务。此次合作旨在为开发者提供经济高效的AI开发解决方案,简化云端GPU部署流程。

  • 微星发布AMD首款纯白ITX主板MPG B850I EDGE TI WIFI刀锋 钛

    微星推出全新MPG B850I EDGE TI WIFI刀锋钛主板,采用ITX规格设计,支持AMD锐龙9000系列处理器和AM5平台。主板配备10层服务器级PCB,提供稳定供电和超频性能。搭载5G有线网口和满血版WIFI7技术,实现低延迟高速传输。采用三层散热装甲设计,包括扩展型VRM散热片、M.2冰霜铠甲和主动散热风扇,确保高性能硬件稳定运行。主板首发售价1799元,提供3年质保+1年上门服务。

  • 腾讯云TencentOS Server AI,助力荣耀打造高性能AI底座

    随着生成式AI技术爆发式增长,AI大模型开始渗透至手机领域。荣耀基于腾讯云TencentOS Server AI的TACO-LLM加速模块部署DeepSeek-R1等开源大模型,在内部场景应用中实现稳定性、可靠性和推理性能的大幅提升。测试显示,使用TACO-LLM后,首Token延迟最高降低6.25倍,吞吐提升2倍,端到端延迟降低100%。TACO-LLM通过投机采样技术实现大模型"并行"解码,从根本上解决计算密度问题,大幅提升解码效率。荣耀表示该方案打造了高性能AI底座,提供高吞吐低延迟的优化方案,能无缝整合现有大模型部署方案。腾讯云TACO-LLM针对企业级AI模型私有化部署挑战,专门优化了大语言模型内核运行效率。

  • iPad为何不运行macOS 苹果高管:macOS未对触摸屏做优化

    iPadOS 26带来了全新的应用视窗、下滑式菜单栏等功能,让iPad的操作体验更接近Mac,但苹果始终未让iPad运行macOS系统,其背后原因正式揭开。 苹果公司软件工程负责人Craig Federighi接受采访时称,iPadOS 26的新特性在生产力与简洁性之间取得了很好的平衡,macOS系统从未对触控屏做优化,我们要保留iPad最本质的简洁性,如果强行移植macOS,iPad将丧失其触控设备的独特价值。 Craig Fed

  • FaceTime成诈骗新工具,认准微粒贷客服号码

    近期出现多起冒充贷款客服的FaceTime诈骗案件,诈骗分子伪装成金融机构客服,以"微粒贷利率过高需注销账户"等理由诱导受害者转账。典型案例中,L先生接到自称微粒贷客服的FaceTime来电,对方以"保护资金安全"为由要求将存款转入指定账户,转账后发现被骗。警方提醒:1.警惕陌生FaceTime来电,不透露个人信息;2.凡提及"调整利率""屏幕共享""转账汇款"等均为诈骗;3.遇可疑情况立即拨打官方客服95384核实;4.若已转账要立即报警并冻结账户。建议通过正规银行渠道办理贷款业务,官方客服不会通过FaceTime联系客户。

  • Galaxy Unpacked 7月见:令人期待的Ultra体验即将在折叠屏展开

    三星电子即将在7月9日纽约发布新一代Galaxy系列产品,重点展示AI技术创新。通过Galaxy AI赋能,新产品将实现从"意图"到"行动"的智能交互变革,突破传统手机功能边界。三星将AI技术与精密工艺结合,打造性能强劲、影像出众的智能设备,重新定义人机关系。发布会将在北京时间22:00通过官网直播,呈现科技与美学的双重盛宴。这不仅是产品迭代,更是三星探索未来体验的重要里程碑。

  • iPad、MacBook、Apple Watch京东PLUS享无门槛9折优惠 至高再减500元!

    京东618推出Apple产品多重优惠:iPhone 16系列最高直降2000元,叠加消费券后512GB版低至7599元起;128GB版享国家补贴后仅5499元起,以旧换新可再减1200元。iPad Air/MacBook Air等享PLUS会员9折叠加国家补贴,如11英寸iPad Air到手价3369元。Apple Watch S10到手1787元起,AirPods4会员价1019元起。所有产品现货发售,优惠券每日10点限量抢,搜索"苹果惊喜券"直达活动页面。

  • 出门问问发布Agentic AI软硬结合产品TicNote,定义新一代“AI思考伙伴”

    出门问问发布新一代AI硬件TicNote,内置"Shadow AI"系统,实现"有记忆的AI记录+主动洞察+主动分析+陪伴创作"功能。该产品通过软硬件结合,成为用户的随身AI思考伙伴,适用于会议、商务沟通、学习等场景。TicNote具备20小时续航、10米远距收音、120+语言转写能力,支持跨文件项目管理。CEO李志飞表示,TicNote是"用AI的AI做AI"的AGI实践产品,标志着公司在软硬结合道路上更进一步。国内版已上线,海外版自2025年4月推出以来获广泛认可。

  • iPadOS 26台前调度适配更多机型:多任务体验比肩macOS

    最新的iPadOS 26升级了台前调度功能,苹果还把该功能扩展到了更多机型。 在上一版iPadOS 18上,台前调度仅限于以下iPad机型: 13英寸iPad Pro(M4芯片); 12.9英寸iPad Pro(第3代及后续机型); 11英寸iPad Pro(第1代及后续机型); iPad Air(第5代及后续机型)。 在iPadOS 26上,台前调度在以下iPad机型上可用: 13英寸iPad Pro(M4芯片);