首页 > 传媒 > 关键词  > 大模型落地加速最新资讯  > 正文

AI智能体创作与分发平台「腾讯元器」上线,开放申请体验

2024-05-17 20:42 · 稿源: 站长之家用户

大模型落地加速,“产业实用”成为发展共识。

2024年5月17日,腾讯云生成式AI产业应用峰会在北京召开,公布大模型研发、应用产品的系列进展。

腾讯混元大模型能力持续升级,多个版本模型hunyuan-pro、hunyuan-standard、hunyuan-lite通过腾讯云对外开放,满足企业客户、开发者在不同场景下的模型需求,落地特出性价比模型方案。

腾讯云大模型知识引擎、图像创作引擎、视频创作引擎三大工具发布,打造大模型时代原生工具链,通过PaaS服务简化数据接入、模型精调、应用开发流程,助力企业更有效、简单地用大模型开发AI原生应用,快速接入生产场景。

以“产业实用”作为发展大模型的核心战略,腾讯集团高档执行副总裁、云与智慧产业事业群CEO汤道生表示,通过打造高性能的模型、有效率的工具平台、高敏捷的场景应用、高可用的算力基础设施,以及强安全的模型环境,构建离产业最近的AI。

(腾讯集团高档执行副总裁、云与智慧产业事业群CEO 汤道生)

腾讯混元开放云上256k长文模型,开启智能体生态

强大的通用大模型,和低门槛的开发工具,都能够提高开发者的生产力,推动大模型生态发展。

在此次产业峰会上,腾讯混元介绍了其多尺寸的LLM模型矩阵,其中,比较大模型已拓展至万亿级参数规模,并在1B、3B、7B、13B等不同参数量下,均有布局。

升级后的腾讯混元,在国内率先采用混合专家模型 (MoE) 结构,模型总体性能相比上一代提升了50%,部分中文能力已追平GPT-4,在“时新”问题的回答表现上,数学、推理等能力上均有较大提升。

在腾讯云上,混元大模型也提供了万亿参数hunyuan-pro、千亿参数hunyuan-standard、百亿参数hunyuan-lite等多种尺寸的模型服务,目前已面向企业及个人开发者全量开放。

(腾讯混元模型服务通过腾讯云对外开放)

其中,hunyuan-standard比较新上线了支持256k超长上下文窗口的长文模型,具备单次处理超过38万字符的超长文本能力,在长文档的阅读理解和大规模数据分析方面展现出强大性能,能够为金融、医疗、教育、出行等行业的专业人士提供强有力的工作支持,显著提高工作效率。

在多模态能力方面,混元大模型也持续迭代升级。在生图领域,腾讯混元文生图基础架构已全面升级至Sora同款的DiT架构,支持中英文双语输入及理解,具备多轮绘图能力,测评结果国内领先;在生视频领域,腾讯混元支持文生视频、图生视频、图文生视频、视频生视频等多种视频生成能力,已经支持16s 视频生成;在生3D层面,腾讯混元已布局文/图生3D,单图仅需30秒即可生成3D模型。

根据沙利文评测结果,腾讯混元的通用基础能力和专业应用能力,都处于国内大模型领跑梯队,高于国际大模型均线。保障评测机构SuperCLUE的报告也显示,腾讯混元大模型位列国内大模型首先梯队,在基础和场景应用上均处于领先位置,位于卓越掌舵者象限。

会上,腾讯集团副总裁蒋杰宣布,腾讯混元大模型将拥抱开源。此前,混元文生图大模型已全面开源,仅3天时间就在Github上获得超千位开发者关注。多种尺寸的腾讯混元MoE模型也即将对外开源,可分别支持手机端、PC端、云/数据中心等多样化的部署场景。

(腾讯集团副总裁 蒋杰)

作为实用级的大模型,目前混元大模型已经在600多个腾讯内部业务和场景中落地测试,并在腾讯丰富的生态中持续迭代能力。微信读书基于混元大模型推出了AI问书、AI大纲等新功能,大大提升用户的阅读效率和体验。腾讯客服团队基于混元大模型升级智能客服体系,创举智能客服垂直领域精调模型,大幅提升智能对话的意图理解准确性和多轮问答流畅性,相比传统小模型下文准确性提升了38%,其人工客服助手在多个游戏客服场景应用,日均用户请求量达到150万次。腾讯会议基于混元推出的AI小助手,可即时回答会议内外问题,大幅提升开会效率。过去四个月,腾讯会议AI小助手的每日调用量增长了20倍。企业微信、腾讯文档等协作SaaS产品也全面接入腾讯混元。腾讯广告基于腾讯混元推出了一站式AI广告创意平台——腾讯广告妙思,助力提升广告生产及投放效率。

蒋杰表示,对外,腾讯混元也将开启智能体生态,上线一站式AI智能体创作与分发平台「腾讯元器」。未来,用户不仅可以在平台上创建专属AI智能体,使用腾讯官方的插件和知识库,还能将这些智能体一键分发到QQ、微信客服、腾讯云等渠道上。

(「腾讯元器」官网开放申请试用https://open.hunyuan.tencent.com/)

腾讯云发布三大AI大模型引擎,5分钟打造一款知识服务应用

以大模型技术为核心,人工智能成为企业数字化发展的关键动力。调研显示,超过60%的中国企业计划在未来12至24个月内部署生成式AI。

但如何找准场景,快速部署,缩短从基础模型到产业应用的距离?

过去一年,腾讯在服务产业客户的过程中,发现产业对模型的需求不断变化。一方面,随着产业信息的载体多元化,模型的需求不仅仅是处理单纯的文字,还需要处理图片、视频等多种信息。大模型的能力竞争从单一文生文,拓展到文生图、文生视频、图生图、图生视频等多模态能力。另一方面,在降本增效的大环境下,企业对“性价比”的要求更高,期待用更简易的大模型工具,加速应用开发,实现快速投产,满足可持续的投入产出比。

为了更好地解决这些需求,腾讯云全新推出大模型原生工具链,以三款PaaS产品——“大模型知识引擎”、“大模型图像创作引擎”和“大模型视频创作引擎”,助力企业在知识服务、图像和视频创作上提质提效。

(腾讯云发布三大AI引擎工具,降低模型应用门槛)

其中,大模型知识引擎聚焦企业知识服务场景,以RAG(检索增强生成)技术架构为基础,整合了OCR文档解析、向量检索、大语言模型、多模态大模型等技术,为企业打造出“低门槛”“有效能”的模型应用开发平台,通过“模块化”的应用模板,企业用自然语言,5分钟就可以开发出一款知识服务应用,快速在客服营销、企业知识社区等各种与人连接的业务场景落地。

目前,腾讯云大模型知识引擎已在政务、金融、教育、出行、零售等多个行业落地。在金融行业,圆心惠保开发出保险代理人的有效惠民智囊,通过大模型技术辅助,自动生成产品知识问答和安抚话术,实现人均提效50%。在教育行业,河南省数字教育发展有限公司,利用知识引擎将河南省万级的中小学教材文档导入,进行知识梳理配置,打造出7×24小时全天候大模型知识助教。

在腾讯内部,多款SaaS应用依托知识引擎进行升级。在客服场景,企点客服大模型文本机器人,接入大模型多轮任务引擎执行账单查询、退换货类等任务,配置成本比传统文本机器人降低50%。在数字人服务场景,数智人接入大模型知识引擎后,更好地理解和识别用户意图,并用大模型生成更专业、更个性化的解答。在企业知识服务场景,腾讯乐享结合知识引擎,在知识生产侧提供“智能写作和生成”能力,在知识消费侧提供“智能问答”能力,让企业员工知识生产和学习更有效,提升组织能力。

在大模型知识引擎之外,图像、视频创作引擎,将通过大模型全面提高素材生成效率。“图像创作引擎”基于腾讯混元的自研图像创作底层模型,输出高质量的AI图像生成和编辑能力,为企业客户提供AI写真、线稿生图、图像风格化等能力。例如,在设计场景,企业客户使用“线稿生图”功能,上传产品线稿设计图后,通过提示词和参数设定,快速生成实物设计图,大幅缩短创作与生产周期。

“视频创作引擎”基于多模态算法技术,输出高质量的视频生成与处理能力,提供视频转译、视频风格化、画布拓展等多种功能。面对企业出海需求,“视频转译”助力企业客户一键将原视频转译成多种语言视频输出,快速投放海外市场,抢得销售先机。

图片8.png

(腾讯云副总裁、腾讯云智能负责人、优图实验室负责人、腾讯企点负责人吴运声)

腾讯云副总裁、腾讯云智能负责人、优图实验室负责人、腾讯企点负责人吴运声表示,腾讯云从产业的实际需求出发,打造出大模型时代的原生工具链,依托三大AI大模型引擎工具,实现数据工程、模型精调、应用开发的流程简化,助力企业更有效、方便地用上大模型。

算力与安全双底座升级,护航生成式AI发展

生成式AI驱动“智能涌现”,为企业带来增长机会,同时也带来全新的安全挑战。在产业实践的过程中,腾讯发现企业拥抱生成式AI的两大障碍,分别是算力资源短缺和安全担忧。

安全合规是企业应用人工智能技术的底线。基于二十多年的安全技术积累,腾讯安全针对AIGC场景,升级推出系统化的安全解决方案。

在数据安全方面,腾讯安全推出了全链路的数据安全解决方案,通过密钥管理系统、堡垒机、数据安全治理中心(API安全监测)等工具,为企业模型训练、精调、发布、运营全生命周期的数据安全保驾护航,助力企业保护敏感数据,保障数据收集安全合规。

在内容安全方面,大模型生成内容经常会遇到虚假信息、内容侵权、诱导风险、个人隐私等非常识性风险。腾讯云天御AIGC 内容合规解决方案,通过专家服务、数据服务、版权服务、机审服务、CEM(客户体验管理)服务五大服务体系,全流程解决AIGC类应用的模型训练、内容生成、事后运营等内容安全挑战。

目前,腾讯云天御已为多个AIGC业态护航,覆盖AI问答、数字人、创作助手、文生图、代码生成、娱乐社交、AI客服等场景。

在算力层面,腾讯云为行业训练大模型提供一站式的AI基础设施。腾讯云通过自研星脉网络3.2T通信带宽和统一的接入层能力,打造了一个可以支持超过10万张卡并行计算,并且能够兼容多种GPU生态的算力集群。腾讯云还推出了国内头个AI原生的向量数据库,比较高支持千亿级向量规模,是国内首先家通过信通院向量数据库能力测评的产品。

生成式AI生态计划发布,构建繁荣生态驱动产业智变

大模型的产业落地是一个广阔的市场,同时也是一个复杂的过程,需要大模型厂商、实体产业、生态伙伴的全产业链攻坚。2023年以来,腾讯云与1500家合作伙伴紧密协同,依托领先和丰富的生成式AI产品,累计服务超过2万家企业客户,初步构建起围绕生成式AI产品的生态体系。

在此次峰会上,腾讯云正式推出生成式AI生态计划。腾讯云副总裁、产业生态合作负责人杨晨表示,腾讯云聚焦做强生成式AI技术和平台底座,通过开放平台能力与服务、提供技术与市场支持的方式,在未来联合千家行业应用厂商,培育千家服务商和万家代理商,共同推动生成式AI技术深入产业全链条,加速产业智能化升级。

图片9.png

(腾讯云联合17家合作伙伴发布生成式AI生态计划)

在能力开放方面,腾讯云将为行业应用厂商开放全量生成式AI产品,以及PaaS、aPaaS、iPaaS等平台及原子能力,助力伙伴在应用侧形成差异化的、有竞争力的解决方案。在服务开放方面,腾讯云将聚焦培育千家生成式AI产品的专业服务伙伴,通过体系化的能力认证,使伙伴形成全流程服务的能力矩阵,为行业落地提高质量交付。在技术和市场支持方面,腾讯云为伙伴提供知识引擎、向量数据库、数智人等7大生成式AI核心产品的专项测试资金,并安排100位大模型架构师、产品专家、算法专家、数据专家陪跑,助力伙伴加速在客户场景的落地和复制。同时,设立生成式AI营销加乘资金,切实助力伙伴开拓市场。

在会上,腾讯云还联合Gartner发布了《生成式AI产业落地路径研究报告》(以下简称《报告》),为企业提供生成式AI应用场景矩阵和生成式AI应用落地路线图,帮助企业解决场景价值、落地可行性等挑战。

汤道生表示,面向智能未来,腾讯将始终坚持“产业实用”的战略方向,坚持用技术去解决一个个实际问题,也将坚持生态开放,与行业、伙伴一起助力产业迎接智能未来”

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 大家在看
  • Mistly:自动记录和分析产品反馈,快速构建更好的产品。

    Mistly是一个AI产品管理工具,能够自动从Slack频道、Zoom通话等地方记录产品反馈,并通过AI技术提供深入的洞察。它可以帮助团队快速了解用户需求,提取功能请求和bug报告,从而加速产品迭代和改进。Mistly还提供每周反馈总结和发布更新通知功能,使客户感到被重视,增强产品与用户之间的联系。

  • Omi:智能合同和文档管理平台

    Omi是一个集中化的平台,提供对财务、合同和供应商的全面监督和管理。它简化了采购流程,实现了财务控制,并通过自动化和实时数据提供决策支持,帮助企业提高效率、节约成本,并确保合规性。

  • iPadOS 18:,带来全新的工作方式和个性化体验。

    iPadOS 18是苹果公司为iPad设备推出的最新操作系统,它通过Apple Pencil、应用程序体验和个性化定制等新功能,进一步增强了iPad的生产力和创造力。该系统利用Apple Intelligence技术,根据用户的个人上下文提供最有帮助和相关的智能服务。

  • 雅意信息抽取大模型:基于大规模数据的高质量信息抽取模型

    雅意信息抽取大模型(YAYI-UIE)由中科闻歌算法团队研发,是一款在百万级人工构造的高质量信息抽取数据上进行指令微调的模型。它能够统一训练信息抽取任务,包括命名实体识别(NER)、关系抽取(RE)和事件抽取(EE),覆盖了通用、安全、金融、生物、医疗、商业等多个场景的结构化抽取。该模型的开源旨在促进中文预训练大模型开源社区的发展,并通过开源共建雅意大模型生态。

  • macOS Sequoia:Mac体验新高度,智能化与生产力的飞跃。

    macOS Sequoia是苹果公司推出的下一代桌面操作系统,它通过iPhone镜像、Safari浏览器的更新、苹果智能技术以及一系列新游戏,为Mac带来了全新的工作方式和变革性的智能特性。它利用了苹果芯片和神经引擎的强大能力,提供了深度集成的个人智能系统,注重隐私保护,并简化了日常任务。

  • iOS 18:iPhone个性化、功能强大、智能化的新高度。

    iOS 18是苹果公司推出的最新操作系统,它通过全新的个性化选项、前所未有的照片应用重设计、强大的连接方式更新以及苹果智能(Apple Intelligence)个人智能系统,为iPhone带来更深层次的个性化体验和智能化功能。

  • Invisibility:您的个人助手,集成到您的操作系统中。

    Invisibility 是一款集成到操作系统中的个人助手应用程序,它通过简单的键盘快捷键,允许用户快速与AI进行交互,提高工作效率。该应用提供了一个平台,结合了所有最新的高级模型,用户无需为多个工具或订阅付费。Invisibility 的设计理念在于简化用户与技术的互动,提供流畅的体验,无需在不同的标签和应用程序之间切换。

  • TeamCreate AI:AI助手,快速构建理想团队

    TeamCreate AI是一个在线平台,提供AI助手来帮助企业在销售、市场、财务、产品和更多领域快速构建团队。这些AI助手是无代码且可定制的,可以快速适应并执行特定任务,帮助企业在没有财务限制和繁琐招聘流程的情况下迅速扩展。

  • Midjourney Personalization:个性化图像生成工具

    Midjourney是一个独立的研究实验室,专注于探索新的思想媒介和扩展人类想象力。它是一个自筹资金的小团队,专注于设计、人类基础设施和人工智能。Midjourney Personalization通过用户对图像对的评分来学习用户的偏好,并根据这些偏好生成个性化的图像。

  • YaFSDP:高效的分布式数据并行框架,专为大型语言模型设计。

    YaFSDP是一个分布式数据并行框架,专为与transformer类神经网络结构良好协作而设计。它在预训练大型语言模型(Large Language Models, LLMs)时比传统的FSDP快20%,并且在高内存压力条件下表现更佳。YaFSDP旨在减少通信和内存操作的开销。

  • Onboard:客户管理的AI邮件平台

    Onboard AI Email Platform是一个专为客户管理设计的AI邮件平台。它集成了先进的AI技术,帮助企业精准地将邮件发送到每个客户的主收件箱,提高邮件的到达率和客户的互动率。该平台通过AI技术对客户进行细分,自动生成个性化内容,并创建AI生成的落地页来驱动客户采取行动。

  • SmartEReply:智能提升您的LinkedIn™互动

    SmartEReply是一个AI驱动的助手,旨在增强您的LinkedIn™互动,通过个性化评论、优化帖子和轻松管理私信来提升您的网络机会。它通过AI生成的内容建议,帮助您快速创建更具吸引力和优化的内容。

  • Freepik Designer:在线设计编辑器,无需设计技能。

    Freepik Designer是一个在线设计编辑器,允许用户无需专业设计技能或软件即可创建或编辑设计作品。它提供了大量的可编辑模板,支持AI工具和功能,如AI写作助手、背景移除、AI翻译器等,以简化工作流程。Freepik Designer由Freepik Company S.L.开发,总部位于阳光明媚的马拉加。

  • Source.Plus:AI训练数据的搜索、整理和丰富工具

    Source.Plus是一个专业的AI训练数据搜索平台,它允许用户通过高级搜索操作符来精确地搜索、筛选和整理所需的数据集。它支持多种数据来源,包括Wikimedia Commons、NMNH - Botany Dept.等,提供广泛的图像和文档资源。平台还具备文件上传功能,使用户能够进一步自定义和丰富自己的数据集。Source.Plus的主要优点包括其强大的搜索能力、数据来源的多样性以及对AI训练数据的特别优化。

  • Awesome-ChatTTS:ChatTTS项目的入门指南和资源汇总。

    Awesome-ChatTTS是一个开源项目,旨在为ChatTTS项目提供常见问题解答和相关资源汇总,帮助用户快速入门并解决在使用过程中可能遇到的问题。该项目不仅整理了详细的安装指南和参数说明,还提供了多种音色种子的示例,以及视频教程等辅助材料。

  • DenseAV:一种自监督的视听特征对齐模型。

    DenseAV是一种新颖的双编码器定位架构,通过观看视频学习高分辨率、语义有意义的视听对齐特征。它能够无需明确定位监督即可发现单词的“意义”和声音的“位置”,并且自动发现并区分这两种关联类型。DenseAV的定位能力来自于一种新的多头特征聚合操作符,它直接比较密集的图像和音频表示进行对比学习。此外,DenseAV在语义分割任务上显著超越了先前的艺术水平,并且在使用参数少于一半的情况下,在跨模态检索上超越了ImageBind。

  • ChatTTS-Forge:基于ChatTTS模型的文本到语音转换项目

    ChatTTS-Forge是一个围绕TTS生成模型ChatTTS开发的项目,实现了API服务器和基于Gradio的WebUI,能够提供全面的API服务,支持生成1000字以上的长文本,保持一致性,并通过内置32种不同风格进行风格管理。

  • WorldDreamer:视频生成的前沿模型

    WorldDreamer是一个创新的视频生成模型,它通过预测遮蔽的视觉令牌来理解并模拟世界动态。它在图像到视频合成、文本到视频生成、视频修复、视频风格化以及动作到视频生成等多个方面表现出色。该模型借鉴了大型语言模型的成功经验,将世界建模视为一个无监督的视觉序列建模挑战,通过将视觉输入映射到离散的令牌并预测被遮蔽的令牌来实现。

  • VividDream:从单一图像或文本生成可探索的3D场景

    VividDream是一项创新技术,能够从单一输入图像或文本提示生成具有环境动态的可探索4D场景。它首先将输入图像扩展为静态3D点云,然后使用视频扩散模型生成动画视频集合,并通过优化4D场景表示来实现一致性运动和沉浸式场景探索。这项技术为生成基于多样真实图像和文本提示的引人入胜的4D体验提供了可能。

  • LlamaGen:自回归模型在可扩展图像生成领域的新突破

    LlamaGen是一个新的图像生成模型家族,它将大型语言模型的原始下一个token预测范式应用于视觉生成领域。该模型通过适当的扩展,无需对视觉信号的归纳偏差即可实现最先进的图像生成性能。LlamaGen重新审视了图像分词器的设计空间、图像生成模型的可扩展性属性以及它们的训练数据质量。

今日大家都在搜的词:

热文

  • 3 天
  • 7天