首页 > 业界 > 关键词  > 火山引擎最新资讯  > 正文

字节参战!火山引擎明确不做大模型 但已服务国内七成大模型厂商

2023-04-19 20:46 · 稿源: TechWeb.com.cn

火山引擎自己是不做大模型的,我们首先服务好国内做大模型的厂商,等他们把大模型做好之后,我们再一起合作开展对外的服务。”火山引擎总裁谭待向TechWeb等表示。

随着ChatGPT的爆火,国内人工智能领域也风起云涌,互联网科技公司纷纷开启大模型军备竞赛。百度、阿里、360等大厂,以及MiniMax、智谱AI等创业公司,都已相继推出自己的大模型产品,与此同时云市场也在加速变革。

作为字节跳动旗下云服务平台,火山引擎明确不会做大模型,但发布了大模型训练云平台。谭待表示,AI大模型有巨大潜力和创新空间,火山引擎会服务客户做好大模型,共同推动各行业的智能化升级。

值得一提的是,在集团层面,字节跳动并未放弃自己做大模型。字节跳动副总裁杨震原在采访中透露,“公司在做一些学习和研究,现在还没有什么结果,未来这方面有了进展再同步。”

火山引擎明确不做大模型

火山引擎是字节跳动于2021年6月推出的云服务业务板块,被外界称为“字节云”,它和协同办公平台飞书共同构成字节跳动对外的To B服务体系。在百度、阿里等大厂相继推出大模型产品之后,有业内人士猜测,火山引擎可能也会推出自己的大模型产品。不过,这一消息被火山引擎方面明确否认。

4月18日,火山引擎原动力大会举办。在会后的采访中,火山引擎总裁谭待明确表示,“火山引擎自己是不做大模型的。”火山引擎将接入多家大模型深度合作,为大模型厂商提供服务。

这个思路与亚马逊类似。日前,亚马逊AWS宣布推出生成式 AI(AIGC)工具“全家桶”,包括用于生成文本、分类、开放式问答和信息提取等任务的生成式大语言模型以及文本嵌入大语言模型等,AWS瞄准的也是企业客户。

谭待表示,国内很多科技公司投入到大模型建设中,他们有优秀的技术团队,也有丰富的行业知识和创新想法,但往往缺乏经过大规模场景实践的系统工程能力。火山引擎要做的就是为大模型客户提供高稳定性和高性价比的AI基础设施。

值得一提的是,虽然火山引擎不做大模型,但在集团层面,字节跳动并未放弃自己做大模型。

今年2月,据36氪报道,字节跳动已经从语言和图像两种模态上布局大模型。其中,语言大模型团队在今年组建,由字节搜索部门牵头,探索方向主要为与搜索、广告等下游业务的结合;图像大模型团队则由产品研发与工程架构部下属的智能创作团队牵头。

3月底,有消息称,阿里M6大模型的前带头人杨红霞已加入字节跳动AI Lab(人工智能实验室),参与语言生成大模型的研发,并在语言生成大模型团队中处于领导地位,直接向字节跳动副总裁杨震原汇报。

对于上述市场消息,字节跳动方面当时均未予以回应。

在火山引擎原动力大会的采访中,杨震原透露,“大模型方面,其实公司也在做一些学习和研究,现在还没有什么结果,等未来这方面有了进展再同步。”

如何满足大模型厂商需求?

大模型需要大算力才能做出来,此外还需要很好的工程能力,去解决千卡甚至万卡并行的训练,去解决好网络问题,以及包括在训练过程中怎样使人可以更早地干预、观测等。

“对火山引擎来说,一方面是算力的供给,另一方面是云原生机器学习平台,以帮助企业应用好算力,进一步提升效率,把大模型训练的又快又稳定。”谭待如此说到。

据介绍,火山引擎机器学习平台经过抖音等海量用户业务长期打磨,支持单任务万卡级别的超大规模分布式并行训练场景。GPU弹性计算实例可灵活调度资源,随用随取,最高可以为客户节省70%的算力成本。

MiniMax是目前国内少数已经推出自研大模型产品的AI技术公司,拥有文本、视觉、声音三种通用大模型引擎能力。据MiniMax联合创始人杨斌介绍,MiniMax与火山引擎合作建立了超大规模实验平台,实现千卡级常态化训练;超大规模推理平台有万卡级算力池,支撑单日过亿次调用。

据谭待透露,国内大模型领域,七成以上已是火山引擎客户,包括智谱AI、昆仑万维等。

会上,火山引擎还宣布与字节跳动国内业务并池。基于内外统一的云原生基础架构,抖音等业务的空闲计算资源可极速调度给火山引擎客户使用,离线业务资源分钟级调度10万核CPU,在线业务资源也可潮汐复用。

只是,字节跳动的国内业务本身,用户数据已经很多,虽然有空闲的计算资源,字节本身也在做大模型的尝试,有多少算力能分到外部?对此,杨震原表示,“并池”实际上是一个技术问题,并不是资源问题。云计算本来就有很多客户,可以去调度一些资源,去错峰互用,把运力提上去。

“比如抖音,其实也有波峰和波谷,晚上或深夜用的人少,这种资源就很适合科学计算的能力,因为这个是批量的,并不需要非常实时的来做这个事情。这个例子也说明了为什么通过资源的混部能够更好降低云计算的成本。”杨震原进一步解释说。

大模型不会一家独大

有评论称,大模型将成为云厂商弯道超车的机会。谭待对此表示,大模型还在发展初期,面临数据安全、内容安全、隐私保护、版权保护等许多问题需要努力解决。但可以预见,大模型将带动云上AI算力急剧增长,AI算力的工作负载与通用算力的差距会越来越小,这会为各家云厂商带来新的机会,同时也会对数据中心、软硬件栈、PaaS平台带来新的挑战。

以数据中心的算力结构为例,谭待表示:“大模型需要大算力,虚拟化会带来资源损耗,规模越大就损耗越多。未来3年内,大规模的算力中心,都将形成’CPU GPU DPU’的混合算力结构,CPU负责通用计算,GPU负责AI计算,DPU负责资源卸载、加速和隔离,提升资源效率”。

此次原动力大会上,火山引擎发布了新一代自研DPU,实现计算、存储、网络的全组件卸载,释放更多资源给业务负载。现场数据显示,火山引擎自研DPU的网络性能高达5000万pps转发能力、延迟低至20us。

谭待认为,在大模型及下游应用发展推动下,无论传统企业还是初创企业,对AI算力都有迫切需求,企业使用多家云服务将成为常态。同时,各行业有自己高质量的私有语料,大模型不会一家独大,而是会在千行百业生长,形成多模型共生甚至协作的生态。

举报

  • 相关推荐
  • 大家在看
  • 挑战拯救痴心“舔狗”,我和大模型都尽力了

    大模型化身为“痴情男大”,等待人类玩家的拯救。一款名为“拯救舔狗”的大模型原生小游戏出现了。大模型在学习这个世界,也在创造一个AINative的世界,无论是大模型原生小游戏是功能越来越全的大模型对话,都在展现世界内容的互动变革,随着尺度规律的不断发展,下一步会怎样?在这次技术交流日上,商汤最后放出了一段文生视频,一起来看看。

  • 巨头狂卷代码大模型

    让AI写代码正在越来越流行。今天蚂蚁集团智能研发平台CodeFuse推出了“图生代码”技术,这一技术集成在CodeFuse上,可将网页、App等设计图一键转化成前端代码。

  • 昆仑万维AI音乐生成大模型「天工SkyMusic」启动邀测

    4月2日,昆仑万维AI音乐生成大模型「天工SkyMusic」开始面向社会免费邀测,邀测将开放1000个免费名额,主要针对行业媒体、专家和音乐从业者。该大模型基于昆仑万维的「天工3.0」超级大模型,是目前国内唯一可用的AI音乐生成大模型。通过这些努力,昆仑万维希望构建一个更加智能、互联、理解和尊重每个人个性的世界。

  • 每日互动持续增强大模型能力,推出、升级多款大模型应用产品

    人工智能引领的"第四次工业革命"正在到来,特别是2023年以来,以大模型、多模态、生成式为特征的新一轮人工智能浪潮席卷全球,带来新的变革。在这机遇与挑战并存的时期,国内专业的数据智能服务商--每日互动快速响应、积极探索大模型、AIGC等先进数智技术,升级产品性能,驱动业务创新,并储备公司下一条S型曲线。每日互动本身就是优质数据资源的持有方,因此在未来,拥有海量鲜活的数据积累、深厚沉淀的数据治理能力、丰富多元的数据应用场景的每日互动将更有可为。

  • 从小数据到大模型,“AI+”何以落地?

    南京师范大学附属中学宿迁分校成立智慧教学小组,并以周为单位,对教师的智慧课堂应用数据进行复盘;中国人民大学附属中学丰台学校的教师们,已经习惯于课后通过课堂智能反馈系统总结自己的上课情况;而通过集体备课平台,北京师范大学广州实验学校的教师们可以随时随地进行线上交流互动和资源共享……在全国各地的中小学,AI技术正与教育不断融合。变化背后,有�

  • 中国首个音乐SOTA模型「天工音乐大模型」今日公测

    2024年4月17日,在「天工」大模型一周年之际,昆仑万维重磅宣布,「天工3.0」基座大模型与「天工SkyMusic」音乐大模型正式开启公测!一年前的今天,第一版天工大模型正式对外发布上线,一年来我们不断迭代模型,迭代应用产品,模型和应用都越做越好,以此回报广大用户的支持。「天工」系列大模型已集成了AI音乐、AI搜索、AI写作、AI长文本阅读、AI画图、AI语音合成、AI漫画创作、AI图片识别、AI代码写作、AI表格生成等多项能力,并将在未来加入AI视频功能,对标“超级应用”,成为人工智能时代的“超级大模型”。在“实现通用人工智能,让每个人更好地塑造和表达自我”的公司使命驱动下,昆仑万维将始终致力于AI技术与产品的创新开拓,不断提高AI产品的用户体验,与用户、研究人员、开发者们携手,共创国产大模型的未来。

  • 大模型时代,AI人才也是各家争夺的焦点

    AI人才争夺战,正式打响!在当今这个由技术驱动的时代,人工智能已成为推动未来创新的关键力量。随着AI技术的飞速发展,一场无声的战争正在硅谷激烈上演——AI人才争夺战。随着全球人才流动的趋势变化,各国也在积极调整策略,以期在未来的AI竞赛中占据有利位置。

  • 从300多个国内大模型中脱颖而出的Kimi是谁?

    大家注意这款国产AI大模型叫Kimi本名是Kimi人工智能助手我们不妨叫它小K这几天小K因为“工作压力”太大彻底崩溃了2月以来它的访问量达305万较上个月增长了107.6%而小K的爆火是从300多个国内大模型中突围而出它们个个来历不凡有科技巨头选派的有高等学府保送的但小K所在的公司成立却才刚满一年图源备注:图片由AI生成,图片授权服务商Midjourney与此同时A股市场与小K有关的概

  • 讯飞星火大模型V3.5升级 推出长文本、长图文、长语音大模型

    科大讯飞今日发布重大更新,讯飞星火大模型V3.5升级,不仅推出了首个长文本、长图文、长语音大模型首次将多情感超拟人合成技术引入市场,并同步推出了星火智能体平台。这一系列创新举措,旨在为招投标应用和合同应用提供更为强大的技术支持。插件市场和原生应用也为开发者和用户提供更多功能和工具选择,共同构建讯飞星火大模型生态。

  • 破局美半导体出口管制:国内首个千亿级MoE架构大模型开源

    在人工智能领域,一场由APUS与新旦智能联手掀起的开源革命正在上演。4月2日,APUS与战略合作伙伴新旦智能联合训练、研发的千亿MoE架构大模型,在GitHub上正式开源。面对人工智能产业的发展与挑战,APUS将通过持续的技术研发与社区共建,积极探索解决方案,不断提升开源大模型的稳定性和泛化能力,确保其在各类复杂应用场景中始终保持领先优势,进一步赋能千行万业。

今日大家都在搜的词: