首页 > 业界 > 关键词  > 腾讯混元大模型最新资讯  > 正文

你的全能AI搭子来了,腾讯混元推出大模型App“腾讯元宝”

2024-05-30 13:44 · 稿源:站长之家

5月30日,腾讯宣布旗下混元大模型全面升级,基于混元大模型的App“腾讯元宝”正式上线,苹果及安卓应用商店均可下载。

image.png

相比此前测试阶段的混元小程序版本,面向工作效率场景,腾讯元宝提供了AI搜索、AI总结、AI写作等核心能力;面向日常生活场景,元宝的玩法也更加丰富,提供了多个特色AI应用,并新增了创建个人智能体等玩法。

“腾讯做大模型不争一时之先。”腾讯云副总裁、腾讯混元大模型负责人刘煜宏表示:“过去的一年,我们持续推进腾讯混元大模型的能力爬坡,在丰富、海量的业务场景中打磨技术,同时洞察用户的真实需求,希望腾讯元宝可以成为用户生活中的好伙伴、好帮手,最终服务于每个普通人的生活。”

image.png

当前,大模型仍在快速发展期,从模型能力到应用落地存在较大“时延”。数据显示,当前人们使用大模型相关产品时,有超过65%的需求,集中在工作/学习效率场景,但相关的AI产品解决方案尚不成熟。

针对效率场景的三大核心需求:信息获取、处理和生产,腾讯元宝均进行了产品化探索。在AI搜索方面,腾讯元宝接入了微信搜一搜、搜狗搜索等搜索引擎,并通过AI搜索增强,提升时新类和知识类问题效果,比传统搜索更有效率;同时,内容覆盖微信公众号等腾讯生态内容及互联网权威信源,答案准确性更高;此外,元宝还会提供所引用的参考资料,并给出相关推荐,方便快速溯源及延伸阅读。

在AI总结方面,元宝可上传最多10个PDF、word、txt等多种格式的文档,并能够一次性解析多个微信公众号链接、网址,支持256K的原生窗口上下文,相当于一本《三国演义》,或是英文原版的《哈利波特》全集。无论是希望快速了解一本书或是一个新领域,还是处理复杂繁冗的报告、文献,元宝都能帮上忙。

在AI写作方面,元宝不仅支持多轮问答,还能够将对话的内容整理成报告,按照要求进行结构化输出,大大提升信息从获取到处理再到生产的效率。

image.png

除了满足效率需要,腾讯元宝在日常生活场景,也提供了丰富的应用及玩法。“发现”栏目全面升级,上线了百变AI头像、口语陪练、超能翻译官等多个特色应用,均免费开放。只需一张照片,用户就可以在百变AI头像里体验多种风格;超能翻译官能够识别15种主流语言,翻译文本、图片与文件,还支持中英文同声传译;口语陪练则像一位专属私人外教,在陪练的同时给到口语改善建议,帮助用户学习与提升。

同时,元宝也支持用户根据个性化需求,快速创建个人专属的智能体,赋予角色设定,或让AI自动生成智能体相关信息,并复刻自己的音色。结合腾讯生态场景,元宝还将于近期推出腾讯新闻哥、《庆余年》主题等特色智能体。

中国科学院大数据专家李猛表示:“腾讯元宝是一款功能强大、易于使用的AI助手产品,为用户带来了便利和高效的智能体验。能够理解自然语言,并提供智能化的回答和建议,这在很多场景下为用户节省了大量时间和精力。”

除在元宝上提供自定义智能体外,腾讯混元也在积极布局智能体生态,面向开发者和企业推出了一站式智能体创作与分发平台腾讯元器。目前,腾讯元器已经全量面向用户开放。

腾讯元器提供丰富的官方插件和知识库,支持用户低门槛创建定制化的智能体,可一键分发至腾讯元宝、微信客服、QQ、腾讯云等腾讯生态渠道,并将于6月支持分发至微信公众号和小程序,混元模型资源全部免费。同时,元器也支持用户以API形式将智能体分发至各类场景,免费token额度从此前的100万提升至1个亿。

腾讯元宝产品能力升级的背后,是混元底层模型的持续迭代。

自2023年9月首次亮相以来,腾讯混元大模型的参数规模已从千亿升级至万亿,预训练语料从万亿升级至7万亿tokens,并率先升级为多专家模型结构(MoE),整体性能相比Dense版本提升超50%。除不断提升通用大模型能力外,腾讯混元也支持角色扮演、FunctionCall、代码生成等领域能力,数理能力提升50%。

在多模态方面,腾讯混元文生图大模型是业内首个中文原生DiT架构模型,采用了Sora、StableDiffusion3等行业顶尖产品的同款架构,生成效果相比上代提升超20%。目前,该模型已经全面开源,在Github获得2000+star,相关能力也全面融入腾讯元宝。

此外,腾讯混元大模型在视频、3D生成等方面也持续探索,目前已经支持16s视频生成,单图仅需30秒即可生成3D模型,相关能力也将于后续在元宝中上线。

目前,腾讯内部有超600个业务及场景都已经接入腾讯混元,腾讯广告、微信读书、腾讯会议、腾讯文档、腾讯客服等,都已经基于混元实现了智能化升级。腾讯广泛的应用场景,也进一步反哺了大模型能力的提升。

image.png

据了解,为了满足开发者及企业客户对于通用模型能力的需求,腾讯混元大模型已通过腾讯云对外开放,可通过API调用,也可以作为基底模型,为不同产业场景构建专属应用。

举报

  • 相关推荐
  • 大家在看
  • TypeflowAI:无需编码,快速构建AI工具。

    TypeflowAI是一个在线AI工具生成器,它允许用户在几分钟内无需编码即可创建AI工具,并通过集成到网站、商业操作和流程中来提升SEO、增加流量和获取更多潜在客户。它提供了一个简单易用的界面,用户可以定义问题、定制AI工具的样式,并发布和交付工具。TypeflowAI通过提供高搜索需求关键词的工具来增加网站流量,并通过动态潜在客户磁铁、AI测验、计算器等吸引用户。

  • Emilia:大规模多语种语音生成数据集

    Emilia是一个开源的多语种野外语音数据集,专为大规模语音生成研究设计。它包含超过101,000小时的六种语言高质量语音数据和相应的文本转录,覆盖了各种说话风格和内容类型,如脱口秀、访谈、辩论、体育评论和有声书。

  • Semantic Chunkers:多模态智能分块库

    Semantic Chunkers 是一个多模态分块库,用于智能地对文本、视频和音频进行分块,提高AI和数据处理的效率和准确性。

  • Starry:AI驱动的沉浸式浏览器,提供双语对照浏览。

    Starry 是一款由 AI 驱动的浏览器,致力于让用户轻松浏览外文网页,消除干扰元素,提供更流畅的浏览体验。它通过双语对照浏览功能,让用户无障碍地浏览互联网外文内容,并在浏览过程中以对照的方式学习外文。AI翻译能力贴近原文表达,摆脱传统机翻困扰。

  • 免费一键部署本地大模型:开箱即用的私有化大模型工具集

    FlashAI免费一键部署本地大模型是一个搭载本地知识库的私有化大模型工具集,支持多种语言,具备文本生成、文档翻译等功能,适用于需要高效处理文本信息的企业和个人。

  • Outwork:个人发展技能提升助手

    Outwork: Self-Improvement 是一款移动应用程序,旨在帮助个人提升个人发展技能。它通过目标跟踪、日常习惯追踪以及Jacob Bot的激励模式,帮助用户实现个人目标,提高生活效率。该应用提供免费下载,并包含一些高级功能,这些功能需要订阅才能访问。Outwork: Self-Improvement 正在积极寻求赞助和资金机会,包括天使投资者和风险资本。

  • Telescope.ai:AI驱动的潜在客户生成平台

    Telescope是一个基于人工智能的潜在客户生成平台,它通过自然语言搜索和类似公司搜索技术,帮助用户快速找到目标市场内的合适人员和公司。它拥有超过900M+个人资料和100M+公司资料,覆盖100+国家,提供丰富的数据点,以极低的跳失率帮助用户精准定位潜在客户。Telescope通过AI学习用户的选择偏好,动态生成目标客户列表,并通过高级搜索功能,让用户能够精确地了解目标公司内应该联系的人员。

  • OnnxOCR:轻量级OCR模型,推理速度快

    OnnxOCR是基于PaddleOCR重构的轻量级OCR模型,它脱离了PaddlePaddle深度学习训练框架,实现了快速的推理速度。该模型支持超过80种语言的推理,并在转换为ONNX模型后,推理速度比使用PaddlePaddle框架快5倍。OnnxOCR独立于深度学习训练框架,可以直接部署,适用于计算能力有限但需要保持准确性的场景,并且可以在ARM和x86架构的计算机上部署。

  • Tabby:开源自托管AI编程助手

    Tabby是一个开源的、自托管的AI编程助手,它利用Rust语言的优势,为开发者提供快速且安全的编程体验。Tabby允许用户通过简单的TOML配置文件来控制部署,确保代码的安全性和合规性。

  • 联想AI网址导航:AI工具聚合平台,一站式服务

    联想AI网址导航是一个集合了多种AI工具的平台,提供包括AI办公、文本写作、音视频处理、绘画图像处理、软件应用和趣味网站等多领域的服务。用户可以通过这个平台快速找到所需的AI工具,无论是提高工作效率、创作艺术作品还是享受AI带来的乐趣,都能在这个平台上找到合适的工具。

  • mixart.ai:AI图像生成器免费版:利用人工智能创建和编辑图像,从未如此简单。发挥人工智能的潜力,根据您的想法轻松生成和定制视觉效果。立即开始创作!

    AI图像生成器免费版让您轻松生成和编辑图像。它采用生成式人工智能技术,能够根据您的文本创作独特的艺术品、动漫风格的图像和许多其他类型的图像。它还可以用于生成自由授权的库存照片、头像、壁纸等。AI图像生成器免费版适用于多种用途,无限可能。

  • AIIQ Portal:AI学习资源库和生成性AI图书馆

    AIIQ Portal是一个为初学者和专业人士提供生成性人工智能学习资源和图书馆的平台,旨在促进AI知识的普及和应用。它提供了丰富的学习资料和工具,帮助用户更好地理解和掌握AI技术。

  • AskAITools Community Edition:为AI产品领域量身定制的前沿搜索引擎项目

    AskAITools是一个为AI产品领域量身定制的前沿搜索引擎项目,旨在通过提供最准确、全面、快速和智能的搜索体验,彻底改变用户发现AI产品的方式。该项目包含商业版和社区版,社区版提供了基本的前端界面和搜索功能,并且代码完全开源。AskAITools采用混合搜索引擎架构,结合了关键词搜索和语义搜索能力,通过统计数据和加权融合技术,实现了相关性和流行度的平衡。

  • ViTMatte:基于预训练的纯视觉变换器提升图像抠图

    ViTMatte是一个基于预训练纯视觉变换器(Plain Vision Transformers, ViTs)的图像抠图系统。它利用混合注意力机制和卷积颈部来优化性能与计算之间的平衡,并引入了细节捕获模块以补充抠图所需的细节信息。ViTMatte是首个通过简洁的适配释放ViT在图像抠图领域潜力的工作,继承了ViT在预训练策略、简洁的架构设计和灵活的推理策略等方面的优势。在Composition-1k和Distinctions-646这两个最常用的图像抠图基准测试中,ViTMatte达到了最先进的性能,并以较大优势超越了先前的工作。

  • AI 生成的 Logo 和提示:AI设计,一键生成个性化Logo。

    AI Logo Designs Gallery是一个在线平台,利用人工智能技术为用户提供个性化的Logo设计服务。用户只需输入品牌名称和一些基本的设计要求,AI即可生成多种风格的Logo供选择。该平台支持多种行业和风格,包括极简、中等复杂度等,满足不同用户的需求。

  • 免费共享的GPT账户:提供多个GPT账号,免费使用AI对话服务。

    本产品是一个提供GPT模型访问权限的网站,允许用户通过共享账号免费体验AI对话服务。产品主要优点包括免费性、易用性以及隐私保护功能,用户可以通过设置密码来隔离对话,确保对话内容的私密性。产品背景信息显示,该服务由社区成员赞助,旨在提供给更多人使用AI技术的机会。

  • AI-Headshots:AI技术快速生成专业头像

    AI-Headshots.net是一个利用人工智能技术快速生成专业头像的网站。用户无需进行传统摄影,只需上传自拍照,AI技术便能在几分钟内生成个性化的头像,提供超过120种不同的风格和背景选择。该技术优化了照明、清晰度和色彩平衡,确保生成的头像具有专业水准。此外,AI-Headshots.net注重用户隐私,不将用户照片用于任何非服务目的。

  • Eggnog:创建AI视频,拥有一致性的角色。

    Eggnog是一个专注于视频制作的网站,它允许用户创建具有独特面孔和服装的角色,并利用这些角色生成动画视频。Eggnog结合了人工智能技术,使得视频制作流程更加简单和高效。它提供了一个用户友好的界面,让用户可以通过拖放的方式将角色放入故事板,并自动生成视频。这种技术的应用不仅提高了视频制作的效率,也降低了进入视频制作领域的门槛,使得更多非专业人士能够轻松创作视频内容。

  • Tidyread:AI驱动的个性化信息摘要服务

    Tidyread是一个利用人工智能技术,为用户提供定制化信息摘要服务的网站。它通过从用户订阅的RSS源中整理和提炼信息,生成干净、高效的资讯简报。用户可以创建多个简报分组(Recipe),并为每个分组设置专属的摘要提示(AI Prompt),以在指定时间接收定制化的信息摘要。Tidyread的主要优点包括:提升信息获取效率、定制化摘要、定时推送、AI过滤和灵活的暂停/启动功能。它适合需要从大量信息中快速获取关键内容的用户。目前,Tidyread提供免费试用。

  • FancyTech:AI驱动的时尚视频创作平台

    FancyTech是一个利用人工智能技术,为时尚行业提供视频创作服务的平台。它通过AI技术简化视频制作流程,快速生成所需的视频素材,帮助用户创作出具有吸引力的时尚视频。该平台的主要优点在于其高效性、易用性和创新性,能够为时尚品牌和创作者提供强大的内容创作支持。

今日大家都在搜的词:

热文

  • 3 天
  • 7天