首页 > 传媒 > 关键词  > 人工智能最新资讯  > 正文

打通AI落地行业“最后一公里”

2024-09-26 11:04 · 稿源: 站长之家用户

今天,在人工智能的推动下,企业数智化转型已进入规模化“倍增创新”的阶段,尤其是AI技术的加速演进,以及应用场景的不断拓展加深,都让各类AI创新应用如雨后春笋般涌现,并加速惠及千行万业。

但与此同时,AI的火热态势,也引爆了智能算力的需求。根据中国信通院发布的《中国算力发展指数白皮书( 2023 年)》显示,在目前的算力规模中,通用算力规模占比达74%,智能算力规模占比达25%,同比增加60%,成为当前算力快速增长的驱动力,而预计未来几年,智能算力的需求将比当前呈现上百倍的增长。

也正因此,企业如何根据业务场景和计算任务选择最适合的算力方案,如何提升数据中心的整体能效,都让算力基础设施迎来了全新的挑战。

不仅如此,根据戴尔科技比较新的“创新催化剂”研究显示,35%的受访企业认为在持续创新的路上缺乏专业人士指导,更有45%的受访企业认为在AI时代下,亟需能够帮助其建议、实施、培训和扩展AI到数据中的服务,以提有效率和运营。从这个角度来说,企业在AI部署、数智化转型的道路上,其面对的挑战和难题不仅仅在于技术方面的“硬实力”,也有包含专业的数字化人才、经验丰富的服务部署支持等“软实力”。

正是洞察到这种全新的变化,戴尔科技积极推动算力基础设施产品和解决方案的技术创新,通过打造“AI First端到端全栈AI平台解决方案”,比较大化帮助企业的现代化数据中心能够释放AI的全部潜力。

在此基础上,近期戴尔科技还在中国市场正式官宣上市全新的AI加速服务器PowerEdge XE9680,提供8个NVIDIA SXM5 500W GPU与NVLink完全互连。这是一款专为需要高性能以及应对新兴复杂AI工作负载而构建的服务器系统,具有高性能、洞察驱动和智能化等特点,真正为AI时代大模型训练和推理构建出了稳定有效的基础设施“算力底座”。

并且,戴尔科技还提供包括AI数据中心服务部署保障与绿色节能实现,由此不仅为更多中国企业的数智化转型提供了坚实可靠的技术支撑,相信也将会更快地打通AI落地行业的“最后一公里”,可以说其价值重要而深远。

AI First全栈解决方案就绪

根据IDC《2024 AIGC应用层十大趋势白皮书》的数据显示,随着AIGC技术的发展,智能化应用将呈现爆发式增长,并预测到2024年全球将涌现出超过5亿个新应用,这相当于过去 40 年间出现的应用数总和,可以说无论是企业还是产业的智能化规模化创新,其本质就是AI应用的扩张,而背后则是需要AI算力和AI基础设施提供关键技术支撑。

对此,戴尔科技集团信息基础架构解决方案事业部AI企业技术架构师、全球CTO大使吴跃表示,一直以来戴尔科技就秉承“AI First”战略,从“AI赋能戴尔产品、戴尔产品组合赋能AI、用AI优化企业运营、构建开放的AI生态”四个维度,帮助各种规模的企业加速AI创新的方法,从而不断发现创造商业机会,保持竞争优势。

其中,针对AI优化的基础架构方面,戴尔科技围绕“算、网、存、管”提供整体参考架构,打造并全面布局了“端到端全栈AI平台解决方案”,最终为企业用户构建有效能的AI平台,具体而言:

01 “算”

在“算”方面,戴尔科技可提供多元化的AI加速计算选型支持,特别是戴尔新一代PowerEdge,先后推出了多款专门针对GPU计算设计和优化的专业服务器,可为企业提供GPU分布式训练解决方案、GPU池化解决方案以及边缘AI计算解决方案等,支持企业面向AI的端到端训练、微调、推理以及面向传统AI(如机器视觉、语音识别)的模型训练及推理场景。

此外,在高性能CPU计算服务器方面,戴尔科技也提供包括集群管理、登录、数据治理等能力。

02 “网”

在“网”方面,随着数据量的增加,现代化数据中心需要更高的数据吞吐量和网络带宽来处理数据的传输和交换,为此戴尔科技也提供端到端400GbE AI计算网络解决方案,帮助企业用户打造新一代网络基础架构,为其加速AI转型提供支撑。

03 “存”

在“存”方面,戴尔科技推出了专为AI打造的新一代PowerScale全闪存节点,这是全球头个率先通过NVIDIA SuperPOD验证的AI以太网存储平台,借助这个全新的平台,企业可以加快创新速度,以更高的灵活性和安全性部署AI应用,同时利用高速的NVIDIA Spectrum以太网技术加速数据访问并借助智能横向扩展实现性能比较大化。

04 “管”

最后,在“管”方面,戴尔科技也提供AI智算平台软件解决方案,为企业提供AI框架与系统管理软件以及专业服务,更好地加速AI工程化、场景化落地,简化AI基础设施平台的管理与资源调配。

不难看出,在全社会走向智能化的大趋势下,AI应用领域的多样化,以及市场规模的不断扩大,已对AI算力和AI基础构架产生了巨大需求,而戴尔科技围绕“算、网、存、管”的需求,打造“端到端全栈AI平台解决方案”可谓“正当其时”,不仅可以加速AI在千行万业中的落地,也能进一步推动各企业乃至整个行业的数智化变革进程。

AI加速服务器“焕新上市”

众所周知,在AI的1. 0 时代,市场上的AI基础设施主要是采用垂直一体式的方案,针对性地满足高性能计算、人工智能、大数据计算等不同的应用负载的需求,其通用性和兼容性比较低;而在AI的2. 0 时代,除了需要满足高性能、安全及可管理性之外,也出现了多元异构加速融合的趋势,即将不同架构的芯片平台、不同的算法模型以及数据集比较大化融合,由此才能比较大化的让AI基础设施算力效率发挥到较好的。

基于此,戴尔科技近期也在中国市场官宣上市面向AI 2. 0 时代的全新AI计算平台PowerEdge XE9680,这是一款 8 路GPU服务器,能够为包括AI、深度学习、训练和推理等工作负载提供较好的的性能。

据戴尔科技集团大中华区服务器解决方案产品高档经理秦建丰介绍,PowerEdge XE9680 具有四大独特优势,具体而言:

▶首先,在高性能方面,PowerEdge XE9680 服务器主要面向较好的AI计算性能需求场景设计。在国内和香港市场,在XE9680 6U的空间内搭载了 8 块NVIDIA超高速GPU,同时还通过NVLink实现了互联,其GPU与高速网卡实现了1:1配比。

事实上,此前在业内保障的MLPerf Inference V3.1推理基准测试结果中,PowerEdge XE9680服务器就在20个数据中心项目赛道中,取得了7个项目的首先名,在所有参评GPU服务器产品中综合成绩理想。

▶其次,在优化设计方面,PowerEdge XE9680 服务器也针对GPU供电和散热进行了单独的优化,其基于6U风冷设计机箱打造,并提供了包括多矢量散热技术,动态调节冷却风强度等全新功能。

并且,PowerEdge XE9680 实现了GPU与CPU模组“统一供电”,同时还对电源进行优化、增强设计,满足实际使用中峰值功率瞬时140%~170%的需求。此外其高速网卡槽位布置于前面板,也有效强化了服务器的散热性能。

▶第三,在多元异构加速方面,PowerEdge XE9680 服务器支持多元异构加速能力,特别是本次戴尔科技和NVIDIA深度合作,打造了“PowerEdge XE9680 + NVIDIA GPU”的方案,就全面满足了企业AI训练、微调、推理等不同的应用需求。

此外戴尔科技也基于NVIDIA全栈AI解决方案,包括GPU、DPU和NVIDIA AI Enterprise软件套件等,进一步满足企业的AI应用需求。数据也显示,与上一代非加速服务器相比,通过NVIDIA加速的PowerEdge服务器在大型语言模型上的推理能效提高了300倍。

▶最后,在安全及可管理性方面,PowerEdge XE9680 服务器也基于“零信任”原则设计,具备更强的安全性和抗风险能力,并在管理方面,其内置的iDRAC也可以动态监控GPU的运行状态,提供碳足迹追踪报告等。

PowerEdge XE9680 服务器的典型应用场景包括AI模型的预训练、AI模型的微调、较大规模AI模型的推理,以及基于单精度(FP32)GPU加速科学计算等;而对于主流的训练、推理以及其他混合工作负载,戴尔科技也提供可以搭载GPU的服务器,如PowerEdge R760xa、R760、R660、R7625、R6625 等,也能满足不同企业用户对AI应用创新的需求。

打通AI落地“最后一公里”

《系统论》认为:系统是由一些相互关联、相互作用、相互影响的组织部分构成并具有某些功能的整体。从系统的角度来看,如果把系统分解为部分,单独研究一个部分,就算把每个部分都研究清楚了,也回答不了系统整体性问题。

事实上,《系统论》的概念很好的表达了当前AI发展逻辑:整个AI的发展乃是一个完整的系统和生态,它的每一个组成部分都应该协同发展,单独某一项技术的突飞猛进,并不能推动AI的落地与普及。

在戴尔科技集团数据中心业务部人工智能佼佼者架构师龚小愿看来,对于今天的企业用户而言,AI时代的到来,给数据中心安全有效运行的基AI础设施和冷却系统都带来更大的压力。

以“PowerEdge XE9680 6U 3+3 8400W”对比“PowerEdge R760*3 6U 1+1 5400W”来看,其功耗提高56%+,同时重量也提高22%+,这也意味着在整个AI基础设施的部署过程中,无论是功耗、散热量、制冷量需求、重量乃至“每U购买成本”都会显著增加,因此如何将绿色节能和降本增效统筹并举,是企业在部署AI基础设施中务必要关注的话题。

为此,戴尔科技也专门打造了“PowerEdge XE9680+Datacenter交付”的创新服务方案,提供包括Dell ProDeploy/ProDeploy Plus专业实施服务以    及Dell Rack Integration机柜集成服务,为企业部署AI基础设施提供“保驾护航”。

▶在专业实施服务方面,戴尔科技可向企业用户提供实用的硬件和软件选择,并通过多种交付选项来满足不同预算和运营模式需求,可满足从核心到云再到边缘的各种业务需求和预算。

研究数据显示,使用Dell ProDeploy Plus服务,其部署规划时间可缩短67%,能够帮助企业节省大量的预部署时间并节省总体时间,同时部署解决方案的速度比管理员快三倍。

▶在机柜集成服务方面,PowerEdge XE9680 也提供“交钥匙”的机柜集成服务,其优势不仅在于可实现“即插即用,提升体验”,同时机柜集成空间也优于传统的功能型的数据中心,每周平均能够集成25台机柜,并能根据企业客户需求随时扩大产能。

关键的是,采用这种机柜集成服务,也能避免不同的现场施工团队采用不一致的施工、配置及质量标准,由此大幅度提升PowerEdge XE9680 部署安装效率,并有效降低“每U购买成本”。

结 语

在AI新时代,戴尔科技提供的“端到端全栈AI平台解决方案”如同一艘“航空母舰”,不仅能够帮助企业构筑健壮的AI基础设施,同时也能够借助“PowerEdge XE9680+Datacenter交付”等创新方式,突破硬件、软件、算力、算法和数据的局限,加快企业AI基础设施的安装和部署,真正打通行业AI落地的“最后一公里”,让更多的企业可以借助AI激发新质生产力,最终推动中国数字经济高质量发展。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 大家在看
  • Qwen2.5-Coder-3B-Instruct:Qwen2.5-Coder系列的3B参数指令调优模型

    Qwen2.5-Coder是Qwen大型语言模型的最新系列,专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5,该系列模型通过增加训练令牌至5.5万亿,包括源代码、文本代码接地、合成数据等,显著提升了代码生成、推理和修复能力。Qwen2.5-Coder-3B是该系列中的一个模型,拥有3.09B参数,36层,16个注意力头(Q)和2个注意力头(KV),全32,768令牌上下文长度。该模型是目前开源代码LLM中的佼佼者,编码能力与GPT-4o相匹配,为开发者提供了一个强大的代码辅助工具。

  • PlayNote:将文件和数据转化为引人入胜的音频创作。

    PlayNote是一款利用尖端AI语音合成技术,将各种文件和数据转换成音频创作的产品。它支持多种文件格式,包括PDF、CSV、TXT等文档,以及PNG、JPEG等图片格式,还有MP4、MOV等视频格式,以及WAV、MP3等音频格式。用户可以上传文件,PlayNote会将文件内容转化为音频,方便用户在各种场合下收听。这项技术的重要性在于它能够提高信息的可访问性,特别是对于视觉障碍人士或者在无法阅读的情况下需要获取信息的用户。PlayNote的背景信息显示,它是由PlayAI提供的,旨在通过技术创新提升工作效率和生活质量。关于价格,用户可以访问Pricing页面了解更多详情。

  • Accio.com:个人采购代理,提供实时数据支持的在线产品搜索平台。

    阿里巴巴在海外推出对话式 AI 搜索引擎 Accio,面向全球商家开放。Accio是一个在线平台,旨在帮助用户进行产品搜索和采购。它利用实时数据为用户提供最新的产品信息,包括创新的圣诞礼物、健身装备套装、可爱毛绒肩包等。Accio的主要优点在于其实时数据更新能力,这使得用户能够获取到最新的市场趋势和产品信息,从而做出更精准的采购决策。此外,Accio还提供了多种语言和货币选项,以满足不同地区用户的需求。

  • Luqo AI:AI驱动的语言学习体验

    Luqo AI是一个AI驱动的语言学习平台,提供个性化的语言学习体验。它通过模拟真实对话和情境,帮助用户提高语言技能,支持多种语言学习,并提供多种学习模式以满足不同用户的需求。Luqo AI由Nexbend公司开发,利用OpenAI技术,并得到Google和AWS等技术的支持。

  • Qwen2.5-Coder-7B:Qwen2.5-Coder系列中的7B参数代码生成模型

    Qwen2.5-Coder-7B是基于Qwen2.5的大型语言模型,专注于代码生成、代码推理和代码修复。它在5.5万亿的训练令牌上进行了扩展,包括源代码、文本代码接地、合成数据等,是目前开源代码语言模型的最新进展。该模型不仅在编程能力上与GPT-4o相匹配,还保持了在数学和一般能力上的优势,并支持长达128K令牌的长上下文。

  • Qwen2.5-Coder-7B-Instruct:7B参数的代码生成语言模型

    Qwen2.5-Coder-7B-Instruct是Qwen2.5-Coder系列中的一款代码特定大型语言模型,覆盖了0.5、1.5、3、7、14、32亿参数的六种主流模型尺寸,以满足不同开发者的需求。该模型在代码生成、代码推理和代码修复方面有显著提升,基于强大的Qwen2.5,训练令牌扩展到5.5万亿,包括源代码、文本代码基础、合成数据等。Qwen2.5-Coder-32B已成为当前最先进的开源代码LLM,其编码能力与GPT-4o相匹配。此外,该模型还支持长达128K令牌的长上下文,并为实际应用如代码代理提供了更全面的基础。

  • Watermark Anything:图像水印技术,可在图片中嵌入局部化水印信息

    Watermark Anything是一个由Facebook Research开发的图像水印技术,它允许在图片中嵌入一个或多个局部化水印信息。这项技术的重要性在于它能够在保证图像质量的同时,实现对图像内容的版权保护和追踪。该技术背景是基于深度学习和图像处理的研究,主要优点包括高鲁棒性、隐蔽性和灵活性。产品定位为研究和开发用途,目前是免费提供给学术界和开发者使用。

  • Bangin' Audio Recorder:轻松捕捉和完善你的音频创意

    Bangin' Audio Recorder是一款专为苹果平台设计的应用程序,旨在简化声音捕捉和想法发展的过程。由音乐作曲家、开发者Alistair Cooper创立,该应用支持高质量单声道或立体声音频录制,具备定制的语音时间戳算法,便于用户扫描和跳过语音录音。它还提供星级评分功能,帮助用户筛选出最佳创意,并支持标签、项目和搜索功能,以保持用户对重要录音的专注。此外,它还具备iCloud同步功能,确保用户在所有苹果设备上的录音保持最新。

  • Agree.com:一站式协议平台,提供安全、智能的电子签名和合同管理服务。

    Agree.com是一个一站式协议平台,它通过AI技术简化合同工作流程,提供生成性AI建议修订、突出关键区域和起草新合同的服务。平台支持免费电子签名、自动化开票、集成支付等功能,帮助企业提高支付收集速度,增加交易速度和收入影响。Agree.com以其直观的平台、强大的功能和安全性,成为创建和管理合同、简化谈判、增强合规性、优化工作流程和转化更多客户的最佳解决方案。

  • TableGPT2:大型多模态模型,集成表格数据

    TableGPT2是一个大型多模态模型,专门针对表格数据进行预训练和微调,以解决实际应用中表格数据整合不足的问题。该模型在超过593.8K的表格和2.36M的高质量查询-表格-输出元组上进行了预训练和微调,规模前所未有。TableGPT2的关键创新之一是其新颖的表格编码器,专门设计用于捕获模式级别和单元格级别的信息,增强了模型处理模糊查询、缺失列名和不规则表格的能力。在23个基准测试指标上,TableGPT2在7B模型上平均性能提升了35.20%,在72B模型上提升了49.32%,同时保持了强大的通用语言和编码能力。

  • Inquir:创建您自己的高级搜索引擎,结合AI技术。

    Inquir是一个强大的工具,用于创建个性化的搜索引擎,根据您的数据量身定制。它解锁了诸如自定义搜索解决方案、数据组合、AI驱动的检索增强生成(RAG)系统以及上下文感知搜索功能等强大功能。通过启动您的引擎或安排演示,迈向改善用户体验的第一步。

  • Fashion-VDM:视频扩散模型,用于虚拟试穿。

    Fashion-VDM是一个视频扩散模型(VDM),用于生成虚拟试穿视频。该模型接受一件衣物图片和人物视频作为输入,旨在生成人物穿着给定衣物的高质量试穿视频,同时保留人物的身份和动作。与传统的基于图像的虚拟试穿相比,Fashion-VDM在衣物细节和时间一致性方面表现出色。该技术的主要优点包括:扩散式架构、分类器自由引导增强控制、单次64帧512px视频生成的渐进式时间训练策略,以及联合图像-视频训练的有效性。Fashion-VDM在视频虚拟试穿领域树立了新的行业标准。

  • Segwise:AI监控广告数据,提升游戏和应用的ROAS。

    Segwise是一个专注于游戏和应用领域的广告数据监控平台,通过AI技术帮助用户监控和分析广告活动数据,及时发现并解决问题,避免广告预算的浪费。产品背景信息显示,Segwise已经筹集了160万美元资金,并且提供了一个名为Melron的AI监控工具,能够自动从移动测量合作伙伴(MMPs)获取和分析数据。Segwise的主要优点包括无需工程师参与、无需信用卡即可开始免费试用,以及提供无缝集成所有数据源的能力。

  • Kiroku:多代理系统,帮助组织和撰写文档。

    Kiroku是一个多代理系统,旨在帮助用户组织和撰写文档。它通过模拟博士论文写作过程中学生与导师的互动,让写作者扮演顾问的角色,而多代理系统则扮演学生的角色。这种流程的优势在于能够快速生成段落序列,通过迭代评估信息来改变沟通方式,并借助大型语言模型(LLMs)讨论复杂话题。Kiroku需要OPENAI_API_KEY和TAVILY_API_KEY来运行,支持Python 3.7至3.11版本。

  • Edify Image:利用像素空间拉普拉斯扩散模型生成高质量图像

    Edify Image是NVIDIA推出的一款图像生成模型,它能够生成具有像素级精确度的逼真图像内容。该模型采用级联像素空间扩散模型,并通过新颖的拉普拉斯扩散过程进行训练,该过程能够在不同频率带以不同的速率衰减图像信号。Edify Image支持多种应用,包括文本到图像合成、4K上采样、ControlNets、360° HDR全景图生成和图像定制微调。它代表了图像生成技术的最新进展,具有广泛的应用前景和重要的商业价值。

  • 免费AI歌曲生成器:使用AI技术创作个性化音乐

    免费AI歌曲生成器是一个在线工具,使用人工智能技术根据用户输入创作个性化歌曲。它结合旋律、和声和节奏,创造完整的歌曲。产品背景信息显示,该工具受到全球超过25,000名音乐家、内容创作者和音乐爱好者的信任。它提供免费、无需订阅的音乐创作服务,支持多种音乐风格,并允许用户商业使用生成的歌曲。

  • Qwen2.5-Coder Technical Report:Qwen2.5-Coder系列技术报告

    Qwen2.5-Coder系列是基于Qwen2.5架构的代码特定模型,包括Qwen2.5-Coder-1.5B和Qwen2.5-Coder-7B两个模型。这些模型在超过5.5万亿个token的大规模语料库上继续预训练,并通过精细的数据清洗、可扩展的合成数据生成和平衡的数据混合,展现出令人印象深刻的代码生成能力,同时保持了通用性。Qwen2.5-Coder在包括代码生成、补全、推理和修复在内的多种代码相关任务上取得了超过10个基准测试的最新性能,并且一致性地超越了同等大小的更大模型。该系列的发布不仅推动了代码智能研究的边界,而且通过其许可授权,鼓励开发者在现实世界的应用中更广泛地采用。

  • Qwen2.5-Coder-14B:代码生成与理解的大型语言模型

    Qwen2.5-Coder-14B是Qwen系列中专注于代码的大型语言模型,覆盖了0.5到32亿参数的不同模型尺寸,以满足不同开发者的需求。该模型在代码生成、代码推理和代码修复方面有显著提升,基于强大的Qwen2.5,训练令牌扩展到5.5万亿,包括源代码、文本代码接地、合成数据等。Qwen2.5-Coder-32B已成为当前最先进的开源代码LLM,其编码能力与GPT-4o相匹配。此外,它还为现实世界应用如代码代理提供了更全面的基础,不仅增强了编码能力,还保持了在数学和通用能力方面的优势。支持长达128K令牌的长上下文。

  • Qwen2.5-Coder-14B-Instruct:Qwen2.5-Coder系列中的14B参数代码生成模型

    Qwen2.5-Coder-14B-Instruct是Qwen2.5-Coder系列中的一个大型语言模型,专注于代码生成、代码推理和代码修复。基于强大的Qwen2.5,该模型通过扩展训练令牌到5.5万亿,包括源代码、文本代码接地、合成数据等,成为当前开源代码LLM的最新技术。它不仅增强了编码能力,还保持了在数学和通用能力方面的优势,并支持长达128K令牌的长上下文。

  • Qwen2.5-Coder-32B:Qwen2.5-Coder系列中参数最多的开源代码生成模型

    Qwen2.5-Coder-32B是基于Qwen2.5的代码生成模型,拥有32亿参数,是目前开源代码语言模型中参数最多的模型之一。它在代码生成、代码推理和代码修复方面有显著提升,能够处理长达128K tokens的长文本,适用于代码代理等实际应用场景。该模型在数学和通用能力上也保持了优势,支持长文本处理,是开发者在进行代码开发时的强大助手。

今日大家都在搜的词:

热文

  • 3 天
  • 7天