首页 > 传媒 > 关键词  > 大模型最新资讯  > 正文

腾讯发布混元大模型Turbo版本 用AI助力场景创新

2024-09-06 10:06 · 稿源: 站长之家用户

大模型落地持续加速中。

9月5日,腾讯宣布推出新一代大模型“混元Turbo”,相比前代模型,腾讯混元Turbo性能显著提升,训练效率提升108%,推理效率提升高,推理成本降低50%,效果在多个基准测试上对标GPT-4o,且第三方测评居国内首先。

目前,混元Turbo已经在腾讯云上线,输入和输出价格只有前代模型的一半。企业和开发者可以通过API、专属模型、精调模型等方式使用混元大模型相关能力。

腾讯集团高档执行副总裁、云与智慧产业事业群CEO汤道生表示,随着大模型与生成式AI的技术突破,图片、视频、语言的理解与生成已经有很大进步,人与人的沟通、人与系统的交互方式,都可能会被重塑。最近半年,产业界对AI大模型的关注重点,开始从模型技术本身,转到智能应用落地上。用人工智能在已有业务场景中降本增效,提高经营效率,是行稳致远的可靠路径。

腾讯集团高档执行副总裁、云与智慧产业事业群CEO汤道生

据介绍,腾讯已经构建起了全链路的大模型产品矩阵,包括底层基础设施、帮助企业训练专属模型的TI平台和行业大模型解决方案,自研的混元大模型,构建应用的平台工具,以及基于大模型的各类智能应用。

会上,腾讯AI应用“元宝”宣布品牌智能体专区正式上线,企业在腾讯元器上制作的智能体可以一键发布到品牌智能体专区。品牌智能体专区首批邀请11家合作伙伴入驻,打造精品AI智能体应用生态,涵盖工作提效和生活娱乐多个场景,用户可以直接在“腾讯元宝”APP上体验丰富的品牌智能体应用。

“面向场景创造价值才是大模型发展的意义。”腾讯云副总裁、腾讯云智能负责人、优图实验室负责人吴运声表示,大模型已经在全球发展了两年,一方面,模型性能不断提升,围绕着模型的产品使用门槛变得更低、更加易用;另一方面,企业积极探索大模型与自身业务场景的结合,大模型的落地场景变得更丰富、更纵深。

腾讯云副总裁、腾讯云智能负责人、优图实验室负责人吴运声

吴运声介绍,基于全矩阵的大模型产品,腾讯已经服务了众多客户,在知识管理、智能客服、研发提效、智能营销、内容生成、办公协同、风险管控等场景中,帮助企业实现了降本增效和业务创新。

大模型工具持续升级,更便捷、更易用

为了让企业更快更便捷地开发AI原生应用,腾讯云在今年5月推出了三款PaaS产品知识引擎、图像创作引擎和视频创作引擎,加速应用落地。

通过大模型知识引擎,企业用自然语言和简单配置,5分钟就可以开发出一款大语言模型应用,服务于客服营销、企业知识社区等业务场景。经过几个月的产品迭代,知识引擎产品在用户需求识别与理解、企业知识处理、检索和理解能力上,都有很大升级。同时,知识引擎支持组件能力单独输出,企业可以按需购买文档解析、文档拆分、向量化等能力,按需部署到自身的应用中去。

在图像创作引擎层面,基于混元生图能力的升级,图像风格化、AI写真、商品背景生成、模特换装等功能也进一步实现了迭代。在AI写真层面,图像创作引擎实现了免训练技术突破,输入一张照片后可直接跳过训练环节等待,一键生成高清写真艺术照,整体出图耗时缩短75%。

针对很多电商商家高频使用的商品背景生成能力,图像创作引擎可实现商品在不同场景中高度逼真的虚拟效果展示。在模特换装场景下,采用3D先验方案,提升重建人像效果,在高度保持模特脸部、手部细节的同时,比较准确将服装版型细节与模特身体特征对齐,确保换装后的效果逼真自然。

基于混元的DiT架构模型,视频创作引擎也迎来了全新的升级。新增了图片跳舞、图片唱演和视频转译等能力,已经实现了单段舞蹈的生成时间从10分钟下降至1分钟级别,同时支持转身、侧身等难度舞蹈动作。同时,针对很多客户有需求的视频转译能力,视频引擎接入了混元文生文大模型和 TTS 技术,让转译后的视频能够保留说话人的音色特征,同时实现说话人口型与目标语种一致的视听效果。目前视频转译功能支持超过15种小语种,覆盖主流外语翻译,可应用于视频本地化、跨境电商等场景。

为了帮助企业用户更便捷地打造专属模型,人工智能开发平台TI平台也进行了全新升级。

TI平台致力于构建面向实战的大模型精调工具链,帮助用户训练出真正可用的大模型,并缩短模型开发周期,提升研发效率与资源利用率。

高质量的训练数据是精调出一个可落地大模型的前提条件。TI 平台的多模态数据集管理和数据标注能力,可提升大模型精调的数据准备效率和训练数据质量,从而提升大模型训练效率和最终效果。

在精调数据准备层面,TI平台全新支持面向多模态大模型的数据集管理和数据标注,首创了基于Schema的标注方法,支持用户自动生成个性化标注工作台,支持文生文、图生文、图文改写、图文混合问答等主流场景下的全部细分任务类型。

落地加速,场景创新更丰富、更纵深

大模型要贴近场景创造价值已经是业界的共识。腾讯目前已经有700多款产品接入混元大模型,实现用户体验的提升。腾讯全矩阵的大模型产品目前已经在知识管理、智能客服、研发提效、智能营销、内容生成、办公协同、风险管控等落地。

在智能客服与知识管理场景中,基于大模型的生成能力,可以显著提升复杂问题的解决效率,提升回答质量。长安汽车与腾讯利用大模型知识引擎,整合汽车使用手册等资料,有效解决了客户在车辆使用和维护中的疑问,显著提升了客户服务体验。

在智能营销场景,大模型可以提升广告素材的生产效率,增强营销活动的趣味性和互动性。比如蒙牛集团利用图生图技术,将用户上传的全家福转化生成为特制的卡通画风,助力会员拉新、提升用户活跃。

在内容创意场景,大模型可以让内容生产的周期大幅缩短,提供更多的创意玩法。比如,人民日报、新华社等媒体结合混元的文生视频能力进行视频创作。过去,视频内容需要一帧帧进行设计和制作,制作周期短则数天,长则数月。现在借助视频生成能力,只需一段文字或者几张图片,就能在几分钟内生成优质视频内容。

在研发提效领域,腾讯利用TI平台等工具,帮助易车、阅文等企业搭建自己的大模型,显著降低了模型构建的时间和成本;另一方面,通过腾讯云AI代码助手等工具,辅助开发者提升研发的效率,帮助企业提升整体研发效能。

在办公协同场景中,腾讯旗下的企业微信、腾讯会议、腾讯文档都已经接入了混元大模型。在大模型的助力下,企业微信可对英文邮件进行智能检查,辅助英文邮件纠错,腾讯会议可以自动总结会议纪要,腾讯文档能够自动生成各类文档。

在风险管控领域,风控大模型可以解决传统风控中建模时间长、效率低的难题。通过打包丰富的反欺诈知识,实现“小样本”训练迁移,快速构建契合业务需求的风控模型体系。比如,东风日产汽车金融,基于少量提示样本迁移,就完成了适配自身业务场景的风控模型定制。相比于传统的建模方式,模型KS性能提升超过20%,在跨场景的泛化性测试上性能提升53%。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 维谛(Vertiv)宣布收购生成式AI软件领军企业Waylay NV

    维谛技术(Vertiv)宣布收购比利时生成式AI软件企业Waylay NV,旨在提升关键数字基础设施的运营智能化水平、系统优化能力及服务体验。此次收购将整合Waylay先进的AI驱动自动化平台,帮助客户实现数据中心电力与热管理系统的实时监控、预测性维护和动态优化,应对AI工作负载快速增长的需求。维谛CEO表示,这将加速公司智能化基础设施愿景的实现,助力客户提升运营效率与�

  • 业界首个!腾讯混元Voyager3D世界模型发布:支持原生3D重建

    今日,腾讯混元官方宣布,HunyuanWorld-Voyager(简称混元Voyager)正式发布,这是业界首个支持原生3D重建的超长漫游世界模型。 该模型在斯坦福大学李飞飞团队发布的世界模型基准测试WorldScore上位居综合能力首位,超越现有开源方法,在视频生成和3D重建任务中均表现出色。 在视频生成和视频3D重建两个任务上,Voyager也均取得更好的结果。

  • 降低创作门槛!爱诗科技新一代生成式大模型加速AI视频大众化

    爱诗科技8月27日发布新一代AI视频生成模型PixVerse V5,实现秒级高质量视频生成,支持360P至1080P分辨率。新模型在真实度、灵活性及生成速度上显著提升,覆盖人物、二次元、商业广告等多场景创作。同步上线Agent创作助手,降低使用门槛,用户无需专业技巧即可一键生成专业级视频。该技术推动AI视频从专业工具走向大众化应用,加速行业落地。

  • 美团也开源了大模型,但我觉得他们的野心是通用生活Agent。

    也有线上体验地址:https://longcat.ai 我自己去体验了一下,整体模型能力,中规中矩,但是快,是真的快,能把560B的模型,在推理的时候搞得这么快,是真的有点牛逼的。 我直接录了个屏给大家看一下。 这里我们可以直观对比一下LongCat和DeepSeek V3的输出速度,他俩都是MoE架构,而且总参数量差不太多。 为了更公平的竞争,用了同一个问题,并关闭了联网搜索来避免搜索干扰�

  • AI日报:AI内容新规正式生效;美团推出开源大模型LongCat;阶跃发布语音大模型Step-Audio 2 mini

    AI日报栏目每日更新AI领域热点内容,聚焦开发者需求。本期重点包括:阶跃星辰发布端到端语音大模型Step-Audio2 mini,在多项基准测试中表现优异;9月1日起AI生成内容需强制标识;美团推出开源大模型LongCat;上海AI实验室发布多模态大模型InternVL3.5;腾讯ARC团队推出音频生成模型AudioStory;OpenAI发布实时语音模型GPT-realtime;Meta与UCSD合作推出DeepConf技术;xAI代码库遭窃事件;阿里巴巴Qwen团队发布GUI自动化框架;微软推出Copilot Labs实验中心;小红书自动化工具xiaohongshu-mcp上线。

  • 寒武纪智能芯片赋能多模态大模型应用

    大模型快速发展推动人工智能技术迈向新阶段,从解决特定任务的弱人工智能向处理通用复杂任务的强人工智能演进。IDC报告显示,2024年中国大模型开发平台市场规模达16.9亿元,人工智能算力市场约190亿美元,预计2025年将达259亿美元。寒武纪等企业专注AI芯片研发,推出多款处理器及加速卡产品,支持大模型训练推理及多模态任务,并与产业链合作共同推进人工智能产业发展。

  • 最高提效8倍!腾讯游戏发布专业游戏AI大模型,美术师做动画不用辣么“肝”了

    在最近与科隆国际游戏展同期举办的Devcom开发者大会上,AI再次赚足了脸面。 微软、腾讯、谷歌、Meta等国际巨头带来超过20场AI相关议题,“AI如何提升游戏美术生产效率”、“AI工具如何与传统工作流无缝集成”、“AI在动画生成、场景构建等具体环节的应用案例”成为开发者们探讨的重点内容。 近年来,游戏美术对精细度的要求呈现指数级增长。随之而来的是几何级增长的

  • AI日报:抖音打击AI技术滥用行为;OpenAI 收购开发数据分析平台 Statsig;ElevenLabs 音效模型更新

    抖音打击AI技术滥用行为,对违规商家和达人采取下架、清退等措施。ElevenLabs音效模型升级至版本2,支持长音频和无缝循环。OpenAI收购数据分析平台Statsig,增强产品迭代能力。亚马逊推出Lens Live AI功能,实时扫描购物。谷歌AI推出Stax工具,帮助开发者评估大语言模型。WordPress推出AI工具Telex简化网站构建。Liquid AI发布LFM2-VL模型,提升手机视觉语言处理。苹果开源FastVLM与MobileCLIP2模型,优化边缘设备AI应用。MetaGPT推出自动化测试工具RealDevWorld,精准率达92%。瑞士发布开源大模型Apertus,提供多语言处理能力。

  • ThinkBook 16+ U7-255H对比AI 9 H365:酷睿优势显著,校园场景体验更佳

    ThinkBook 16+ 2025款搭载酷睿Ultra 7 255H和锐龙AI 9 H365处理器,性能对比显示酷睿版在核心性能、图形处理、AI算力、续航及屏幕亮度等方面全面领先。酷睿版凭借更高主频、更强核显及AI加速技术,在校园学习、多任务处理及游戏场景中表现更优,且价格更具性价比,适合学生和职场新人选择。

  • 华为Mate XTs影像大提升:主摄、超广角、长焦全部升级RYYB传感器

    今天下午,华为正式发布了全球第二款商用三折叠手机华为 Mate XTs 非凡大师系列。 此次新品在影像体验能力上迎来全面升级,核心配置的迭代让用户无论在何种场景下,都能捕捉到更高质量的画面。 在关键的影像硬件上,华为Mate XTs非凡大师将超光变主摄、超广角镜头与长焦摄像头全部升级为RYYB传感器。 熟悉华为影像技术的用户都知道,RYYB传感器通过优化色彩滤镜排列,

今日大家都在搜的词: