首页 > 热点 > 关键词  > 腾讯云智能小样本数智人最新资讯  > 正文

腾讯云智能小样本数智人生产平台发布 支持多模态数据输入

2023-04-26 08:35 · 稿源:站长之家

站长之家(ChinaZ.com)4月26日 消息:昨日,腾讯云智能小样本数智人生产平台首次对外发布,平台具有训练样本小、生产效率高、自动化生产等特性。只需要3分钟真人口播视频、100句语音素材,平台便可通过音频、文本多模态数据输入,实时建模并生成高清人像,在24小时内制作出与真人近似的“数智人”。

微信截图_20230426083808.png

按日更计算,如果以“妆发+调试+录制”平均两小时/期来算,一周就可以省下14个小时,一年可节省近800-900小时,相当于省下30-40天的制作时间。

微信截图_20230426083526.png

小样本数智人支持半身、全身形象展示,手势动作会根据内容灵活调整,也支持录制背景任意更换,适用于直播带货等更广泛的商用场景。相较于2D真人精品数字人,小样本数智人无需专业影棚录制素材,成本更低;相较于照片生成、仅能呈现面部形态的数字人,小样本数智人可根据文本设计手势,唇动、口型、表情复现真人风格。

腾讯表示,目前,已经有数十家合作伙伴依托平台,向行业提供数智人直播SaaS、知识口播SaaS应用,覆盖医疗、传媒、金融多个行业。

举报

  • 相关推荐
  • 多模态训练提速45% 百度智能云推出开源全模态训练框架

    多模态大模型时代,训练基础设施正面临结构性错位。传统框架基于“数据同质、结构单一、平台固定”设计,难以应对多模态异构数据、模型组件协同及跨平台算力需求。百度百舸开源的全模态训练框架LoongForge,以Megatron为核心引擎,通过统一模型抽象、系统层优化和硬件插件化设计,实现“一套代码多平台运行”。其CCT通算传并行、ChunkPipe流水线并行、自适应FP8等技术,在主流模型上实现15%-45%端到端训练加速,在DeepSeek等前沿架构上实现倍级性能提升,并在5000+卡昆仑P800集群上达到90%+线性扩展效率。

  • 数智家庭新生态点亮美好生活

    2026年5月15日,辽宁移动人工智能合作发展大会在沈阳举行,重点展示AI+生活一站式智慧服务。核心产品“灵犀屏”实现智能电视、音箱、学习平板、云电脑、可视电话“五屏合一”,搭载自研家庭智能体,支持语音交互与多轮对话。同时推出全屋智能解决方案,覆盖家居、学习、健康等六大领域,通过“移动爱家”服务模式提供一体化数字家庭生态,累计销量已突破万台。

  • 腾讯自研AI设计智能体Ardot公测:一句话生成可编辑设计稿

    今日,腾讯云宣布,腾讯自研AI设计智能体平台Ardot正式公测,现在注册即可获得1000 Credits免费额度。 据介绍,过去不少AI设计工具的使用方式,往往是通过一句话生成一张图片,视觉效果虽然不错,但后续修改、复用和交付并不方便,难以真正进入团队生产流程。 而Ardot的核心思路,是让AI生成的每一张图片、每一个界面,都成为可编辑、可复用、可交付的团队资产。 Ardot�

  • 2026中国大消费年度盛典落幕,百菲乳业凭全链数智实力摘得年度价值品牌殊荣

    大消费产业正转向“质效并重”的高质量发展新赛道。在“2026中国大消费年度盛典”上,百菲乳业凭借连续三年全国全网水牛奶销量第一的成绩,荣获“年度价值品牌”奖。企业依托广西灵山的奶水牛产业优势,构建了数字化养殖、智能生产、智慧物流的全产业链闭环,从源头到终端全方位保障品质。通过技术创新与产学研合作,百菲乳业以科技驱动产业升级,未来将继续深耕水牛奶赛道,助力特色乳业高质量发展。

  • 以数智化为锚,地上铁破局车辆资产运营管理难题

    第九届数字中国建设峰会在福州落幕,聚焦“数智融合赋能产业升级”。地上铁携“链车宝”首次亮相,针对新能源物流车资产运营痛点,推出车辆资产运营数字化中枢,覆盖客户、资产、订单、风控、财务及数据驾驶舱六大模块,实现资产透明、风控智能、收益最大化,并构建FMaaS模式,管理超21万台车辆,推动行业数智化转型。

  • 像素吐司v1.3实测:4K 人像视频精修达到专业级水准

    像素吐司v1.3是一款专业AI人像视频处理工具,基于独立测试环境(Win11, i7-12700H, RTX 3060, 32GB RAM)验证其五大核心功能:AI精准追色(色差ΔE<2.5)、真实美颜质感(4K纹理保留93%)、精准追踪与帧稳定(波动<5%)、肌肤处理(含中性灰磨皮,效率提升50倍)及面部塑形(自然微调)。该工具通过智能场景分割与批量处理,可大幅提升电商、婚礼、Vlog等场景的视频精修效率,兼顾专业细节与易用性。

  • 真实世界数据飞轮:灵初智能正在构建具身智能的新护城河

    具身智能行业共识:缺乏真实世界数据难以训练出可落地的机器人。不同于语言模型和自动驾驶,机器人需学习复杂物理交互,涉及视觉、语言、空间、触觉等多模态融合。摩根士丹利指出,机器人“大脑”技术未定型,真实世界数据正成为核心壁垒。灵初智能通过自研数据采集方案ψ-SynEngine,大幅降低成本并积累10万小时人类手部操作数据,开源首批1000小时数据集。其核心在于构建“数据—模型—执行—反馈—再训练”闭环,让每次场景落地转化为数据积累,推动模型持续进化。未来竞争将聚焦于稀缺、有效、可持续的真实世界数据掌控能力。

  • 可灵AI携中美韩三国导演亮相戛纳,打造AI影视工业化全球样本

    在戛纳电影节上,可灵AI举办论坛,聚焦AI在影视工业中的应用。中、美、韩导演分享了三条路径:混合制作模式(如《大卫王朝》成本仅为传统三分之一,观看人数超5000万)、纯AI院线电影(如《RAPHAEL》仅7人团队完成)和AI赋能传统动画(如《镖家风云》制作周期缩短三分之一)。可灵AI的原生4K功能成为工业级交付关键,导演们强调AI降低了成本与周期,让创作更聚焦于想象力与故事本身。

  • AI日报:千问PC端上线AI语音输入;字节发布全模态大模型Doubao-Seed-2.0-lite;谷歌更新AI搜索功能

    本期AI日报涵盖多项重要进展:千问PC端上线AI语音输入,提升办公效率;字节跳动发布全模态大模型Doubao-Seed-2.0-lite,实现视频、图像、音频与文本统一理解;腾讯联合多所高校推出开源多模态深度搜索智能体方案OpenSearch-VL;月之暗面申请“KimiClaw”商标,或涉硬件领域;Mininglamp开源Cider和Mano-P,打造本地AI工作站;OpenAI携手硬件巨头发布MRC协议,解决GPU闲置浪费;谷歌升级AI搜索功能,整合Reddit等社交观点;xAI推出Grok Imagine API质量模式,提升图像生成写实度。

  • AI日报:腾讯云QClaw发布文件空间;阿里通义千问接入淘宝;微信推AI支付等功能

    本日AI日报涵盖八大热点:腾讯云QClaw发布“文件空间”打通生态;微信4月大升级引入AI支付;阿里通义千问接入淘宝重塑购物体验;Google升级Gemini API文件搜索;阶跃星辰StepAudio2.5语音模型位列全球前三;贾跃亭重返法拉第未来转型物理AI公司;中国AI大模型周调用量2.11倍反超美国;MiniMax关联公司增资至40亿元。

今日大家都在搜的词: