首页 > 业界 > 关键词  > 火山引擎最新资讯  > 正文

字节参战!火山引擎明确不做大模型 但已服务国内七成大模型厂商

2023-04-19 20:46 · 稿源: TechWeb.com.cn

火山引擎自己是不做大模型的,我们首先服务好国内做大模型的厂商,等他们把大模型做好之后,我们再一起合作开展对外的服务。”火山引擎总裁谭待向TechWeb等表示。

随着ChatGPT的爆火,国内人工智能领域也风起云涌,互联网科技公司纷纷开启大模型军备竞赛。百度、阿里、360等大厂,以及MiniMax、智谱AI等创业公司,都已相继推出自己的大模型产品,与此同时云市场也在加速变革。

作为字节跳动旗下云服务平台,火山引擎明确不会做大模型,但发布了大模型训练云平台。谭待表示,AI大模型有巨大潜力和创新空间,火山引擎会服务客户做好大模型,共同推动各行业的智能化升级。

值得一提的是,在集团层面,字节跳动并未放弃自己做大模型。字节跳动副总裁杨震原在采访中透露,“公司在做一些学习和研究,现在还没有什么结果,未来这方面有了进展再同步。”

火山引擎明确不做大模型

火山引擎是字节跳动于2021年6月推出的云服务业务板块,被外界称为“字节云”,它和协同办公平台飞书共同构成字节跳动对外的To B服务体系。在百度、阿里等大厂相继推出大模型产品之后,有业内人士猜测,火山引擎可能也会推出自己的大模型产品。不过,这一消息被火山引擎方面明确否认。

4月18日,火山引擎原动力大会举办。在会后的采访中,火山引擎总裁谭待明确表示,“火山引擎自己是不做大模型的。”火山引擎将接入多家大模型深度合作,为大模型厂商提供服务。

这个思路与亚马逊类似。日前,亚马逊AWS宣布推出生成式 AI(AIGC)工具“全家桶”,包括用于生成文本、分类、开放式问答和信息提取等任务的生成式大语言模型以及文本嵌入大语言模型等,AWS瞄准的也是企业客户。

谭待表示,国内很多科技公司投入到大模型建设中,他们有优秀的技术团队,也有丰富的行业知识和创新想法,但往往缺乏经过大规模场景实践的系统工程能力。火山引擎要做的就是为大模型客户提供高稳定性和高性价比的AI基础设施。

值得一提的是,虽然火山引擎不做大模型,但在集团层面,字节跳动并未放弃自己做大模型。

今年2月,据36氪报道,字节跳动已经从语言和图像两种模态上布局大模型。其中,语言大模型团队在今年组建,由字节搜索部门牵头,探索方向主要为与搜索、广告等下游业务的结合;图像大模型团队则由产品研发与工程架构部下属的智能创作团队牵头。

3月底,有消息称,阿里M6大模型的前带头人杨红霞已加入字节跳动AI Lab(人工智能实验室),参与语言生成大模型的研发,并在语言生成大模型团队中处于领导地位,直接向字节跳动副总裁杨震原汇报。

对于上述市场消息,字节跳动方面当时均未予以回应。

在火山引擎原动力大会的采访中,杨震原透露,“大模型方面,其实公司也在做一些学习和研究,现在还没有什么结果,等未来这方面有了进展再同步。”

如何满足大模型厂商需求?

大模型需要大算力才能做出来,此外还需要很好的工程能力,去解决千卡甚至万卡并行的训练,去解决好网络问题,以及包括在训练过程中怎样使人可以更早地干预、观测等。

“对火山引擎来说,一方面是算力的供给,另一方面是云原生机器学习平台,以帮助企业应用好算力,进一步提升效率,把大模型训练的又快又稳定。”谭待如此说到。

据介绍,火山引擎机器学习平台经过抖音等海量用户业务长期打磨,支持单任务万卡级别的超大规模分布式并行训练场景。GPU弹性计算实例可灵活调度资源,随用随取,最高可以为客户节省70%的算力成本。

MiniMax是目前国内少数已经推出自研大模型产品的AI技术公司,拥有文本、视觉、声音三种通用大模型引擎能力。据MiniMax联合创始人杨斌介绍,MiniMax与火山引擎合作建立了超大规模实验平台,实现千卡级常态化训练;超大规模推理平台有万卡级算力池,支撑单日过亿次调用。

据谭待透露,国内大模型领域,七成以上已是火山引擎客户,包括智谱AI、昆仑万维等。

会上,火山引擎还宣布与字节跳动国内业务并池。基于内外统一的云原生基础架构,抖音等业务的空闲计算资源可极速调度给火山引擎客户使用,离线业务资源分钟级调度10万核CPU,在线业务资源也可潮汐复用。

只是,字节跳动的国内业务本身,用户数据已经很多,虽然有空闲的计算资源,字节本身也在做大模型的尝试,有多少算力能分到外部?对此,杨震原表示,“并池”实际上是一个技术问题,并不是资源问题。云计算本来就有很多客户,可以去调度一些资源,去错峰互用,把运力提上去。

“比如抖音,其实也有波峰和波谷,晚上或深夜用的人少,这种资源就很适合科学计算的能力,因为这个是批量的,并不需要非常实时的来做这个事情。这个例子也说明了为什么通过资源的混部能够更好降低云计算的成本。”杨震原进一步解释说。

大模型不会一家独大

有评论称,大模型将成为云厂商弯道超车的机会。谭待对此表示,大模型还在发展初期,面临数据安全、内容安全、隐私保护、版权保护等许多问题需要努力解决。但可以预见,大模型将带动云上AI算力急剧增长,AI算力的工作负载与通用算力的差距会越来越小,这会为各家云厂商带来新的机会,同时也会对数据中心、软硬件栈、PaaS平台带来新的挑战。

以数据中心的算力结构为例,谭待表示:“大模型需要大算力,虚拟化会带来资源损耗,规模越大就损耗越多。未来3年内,大规模的算力中心,都将形成’CPU GPU DPU’的混合算力结构,CPU负责通用计算,GPU负责AI计算,DPU负责资源卸载、加速和隔离,提升资源效率”。

此次原动力大会上,火山引擎发布了新一代自研DPU,实现计算、存储、网络的全组件卸载,释放更多资源给业务负载。现场数据显示,火山引擎自研DPU的网络性能高达5000万pps转发能力、延迟低至20us。

谭待认为,在大模型及下游应用发展推动下,无论传统企业还是初创企业,对AI算力都有迫切需求,企业使用多家云服务将成为常态。同时,各行业有自己高质量的私有语料,大模型不会一家独大,而是会在千行百业生长,形成多模型共生甚至协作的生态。

举报

  • 相关推荐
  • 腾讯云智算三大核心升级 推动AI Infra从“支撑”向“引擎”跨越

    腾讯云在9月17日全球数字生态大会上宣布AI基础设施升级,聚焦智能体驱动云基础设施演进。发布多项成果,包括Agent+Infra解决方案、Cloud Mate云专家服务智能体,提升推理效率、安全性和自动化能力。预计未来两年企业部署智能体将翻倍,GenAI相关IaaS支出增速达192%。腾讯云通过“同源同构”技术优势,支持多环境部署,为交通、制造等行业提供全链路AI支撑,加速产业智能化转型。

  • 拥抱AI变革,点燃算网引擎:2025开放数据中心大会在京召开

    2025年9月9日至11日,以“拥抱AI变革,点燃算网引擎”为主题的2025开放数据中心大会在北京成功举办。大会聚焦算力技术发展,发布63项研究成果,涵盖服务器、数据中心设施、网络、边缘计算、智能运营等领域。多位行业专家分享前沿趋势,强调加强算力标准布局与产业协同,推动开放融合的算力生态建设。同期举办近20场分论坛及人才培训活动,旨在汇聚产业智慧,赋能行业提质增效,加速数字经济发展。

  • 锻造新质生产力新引擎 三大创新背后的海尔探索

    9月19日,“现代化进程中的新质生产力”国际研讨会在北京召开。会议由国务院新闻办公室、国家发展改革委指导,中国人权发展基金会、中国宏观经济研究院、海尔集团联合主办。会议聚焦激发新质生产力,推动经济社会高质量发展。海尔集团代表周云杰强调企业是发展新质生产力的核心主体,需通过科技创新、激发人才活力和构建开放生态实现突破。2024年海尔业绩创新高,全球收入达4016亿元,增长8%,利润总额302亿元,增长13%。会议呼吁企业从有限博弈转向无限共创,以科技引领产业升级,服务国家战略。

  • 快手举办2025双11商家大会,公私域联动驱动增长新引擎

    快手“破峰双11”2025商家大会在广州举办,面向商家、达人及品牌群体分享双11大促的平台政策和流量玩法,助力实现全域增长。大会重点探讨公私域联动、短直联动及品牌新增增长策略,强调私域成交效率是公域的4倍以上。快手电商将投入180亿流量补贴,并提供红包和商品补贴,帮助商家提升经营能力。数据显示,快手电商GMV同比增长17.6%,月均买家数达1.34亿,用户粘性和消费活跃度持续提升。

  • 省心投放、快速冷启,快手磁力引擎推出“中小商家自助营销投放解决方案”

    快手磁力引擎推出“中小自助投放解决方案”,通过智能投放、AIGC技术赋能、政策扶持等多维度助力中小商家。该方案提供全自动投放产品UAX,显著提升跑量稳定性与成本控制;磁力开创平台支持高质量视频素材智能化生产;专属账户管理与投放策略服务保障投放全流程高效。实测显示,客户线索成本降低6%,跑量提升373%,助力商家实现更高效经营。

  • 首周曝光超3.7亿,快手磁力引擎“开学装备开新局”助力商家抓住开学季增长机遇

    快手平台于9月1日至23日推出“开学装备开新局”活动,聚焦学生及家庭开学季消费需求。活动通过百万红包、流量扶持、商业化政策叠加及盲盒抽奖等多元玩法,覆盖数码、美妆、家居等多个品类。数据显示,活动首周曝光量达3.77亿,多款开学装备销量显著增长。平台锁定18-23岁学生及36-40岁妈妈群体,精准匹配军训、宿舍、学习、社团四大场景需求,助力商家提升转化率。活动整合线上线下资源,构建“内容种草-搜索触达-会场转化”闭环,以亿级流量助推商家实现生意爆发。

  • 天网杯纳米AI视频创作赛圆满落幕,ISC.AI学苑推动“教育AI+”新范式

    9月23日,第三届“天网杯”网络安全大赛在天津落幕,吸引全国顶尖战队角逐,同期举办纳米AI视频创作赛。赛事聚焦个人信息保护、防诈 骗等网络安全议题,通过“以赛促学”模式提升学生防护意识与AI应用能力。ISC.AI学苑作为平台支持,依托“纳米AI”技术降低创作门槛,推动“安全+AI”人才培养。大赛评选出24个奖项,并联合多所高校深化合作,促进AI技术在教育场景的落

  • “老登”应用,霸榜AI

    AI应用的争夺战,打到哪儿了? 如果把整个AI行业想象成一座金矿:基础设施层(芯片、算力)相当于“卖铲子”,提供挖矿的基础工具;模型层(大模型研发)好比“卖地图”,告诉大家哪里有金子;而应用层是直接“下场淘金”,把金子变现。 近两年AI应用的使用者越来越多,QuestMobile数据显示,截止到2025年8月,移动端AI应用用户规模达6.45亿,PC端达2.04亿。其中原生APP亿级应用的

  • AI投资,走到哪了?

    AI赛道,从不缺少追梦人。 多年来,创业者的名单持续刷新。从“AI四小龙”时代的汤晓鸥、印奇、朱珑、周曦,到大模型爆发后的王慧文、李开复、王小川、杨植麟、闫俊杰、唐杰,再到眼下炙手可热的90后王兴兴、彭志辉、肖弘、郭文景.....众多或熟悉或陌生的名字,纷纷涌入这场AI的浪潮。 推动这股浪潮加速前进的,还有另一股力量——资本。红杉、高瓴、英诺天使、毅

  • 观中国精度何以锻造:光子精密场景深耕+技术突围双引擎

    深圳光子精密通过自主研发,攻克高精度3D线激光轮廓测量技术,实现微米级检测精度,打破日美企业垄断。其产品应用于半导体、新能源等领域,构建“核心部件-算法-整机”全技术栈,服务全球70余家500强企业。公司坚持高研发投入,拥有120项自主知识产权,以“场景深耕+技术突围”推动国产替代,成为高端制造领域可靠合作伙伴。

今日大家都在搜的词: