首页 > 传媒 > 关键词  > 生成式AI最新资讯  > 正文

阿里大文娱CTO郑勇:创新技术,打造适合中国影视行业的AI能力

2023-06-12 14:18 · 稿源: 站长之家用户

生成式AI正在颠覆数字娱乐行业,随着今年初ChatGPT的问世,整个内容行业也将迎来巨变。” 6 月 11 日,在 2023 全球人工智能技术大会智能传媒论坛上,阿里大文娱CTO郑勇表示,将推动AI与影视深度融合,创新技术,打造适合中国影视行业AI能力

回顾影视发展历程,从有声电影到彩色电影,从特 效电影再到如今AR、VR等形式拍摄的影片,每一次变革,都与技术飞跃息息相关。国家“十四五”规划中,围绕促进文化产业繁荣,也提出科技创新赋能行业发展,优化并重构内容生产技术体系的目标。对此郑勇表示,阿里大文娱正通过布局帧享数字化制作等技术,参与中国影视行业数字化升级中。

(阿里大文娱CTO郑勇发表主题演讲)

论坛上,通过一段3D虚拟拍摄短片的展示,郑勇介绍帧享数字化制作已经实现3D虚拟拍摄的全自动校准算法,让屏幕中的虚拟背景根据摄像机位置实现实时追踪,提升画面空间与颜色校准30%的效率。此外,要实现3D虚拟拍摄的广泛应用,很大程度依赖数字资产的沉淀与复用,目前帧享引入AI能力辅助制作,让数字资产制作效率提升了 3 倍。为此,帧享建设了独 家数字资产平台,实现资产的积累与流转。

(帧享数字化制作3D虚拟拍摄方案)

“有了更快的资产制作和沉淀能力,才能降低成本,提有效率,让3D虚拟拍摄的应用落地成为可能。”郑勇说,目前帧享3D虚拟拍摄中的上屏素材,都可以现场实时调整,大到漂浮的空间站,小到一片云,都能根据导演的需要,调整位置、角度、颜色等效果,导演可以现场发挥创意;而在这种环境中,也帮助演员提升了代入感和信念感,完全不同于以往在绿幕前通过想象进行表演。

此外,帧享2D数字资产已经沉淀了超过一万小时,包括街景、地标性建筑、自然景观,以及雪景、海边等较难取景的环境。“2D虚拟拍摄方案相比传统绿幕拍摄,窗景成本能够节省超过50%;车戏的拍摄效率可以从每天 4 页剧本,提升到每天拍 7 页,效率提升超过70%。”

(阿里大文娱首 个超写实数字人“厘里”)

郑勇透露,阿里大文娱首 个超写实数字人“厘里”,也将在优酷接下来的一部剧集中出演角色,这也是数字人首 次参演真人影视剧的实践。作为已经实现了影视级精度的虚拟偶像,“厘里”以代言、直播、数字藏品等形式,已经与英特尔、MLB、天猫等多个品牌合作。不久前,“厘里”还在动画电影《铃芽之旅》中展开跨次元联动,为电影宣发提供了创新营销模式。

AI提高了文娱行业生产效率的同时,也让创作者可以将更多精力投入到内容创意和打磨中,“阿里大文娱会继续探索前沿技术在文娱行业的‘打开方式’,让新技术在更多高质量作品涌现的过程中发挥作用,让艺术更好地呈现在人们眼前。”郑勇说。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 女子用ChatGPT选号中百万大奖 全部捐出帮助有需要的人

    美国弗吉尼亚州女子卡丽爱德华为非经常购彩者,近日通过手机向ChatGPT询问彩票号码建议,AI提供几组数字供参考。她购买后幸运中得15万美元(约106万元人民币)大奖。领奖时她当场宣布将全部奖金捐出,帮助有需要的人,并表示自己已足够幸运,希望以此鼓励其他中奖者回馈社会。

  • AI日报:腾讯重磅发布混元图像3.0;快手发布KAT系列Agentic Coding大模型;苹果悄然研发ChatGPT式应用

    快手发布KAT系列代码大模型,腾讯推出“混元图像3.0”实现多模态突破,苹果研发类ChatGPT应用升级Siri,谷歌更新Gemini 2.5 Flash Lite提升效率。苹果还推出Manzano图像模型,YouTube Music测试AI音乐主播功能,VideoFrom3D框架简化3D视频生成,Moondream 3.0在多项基准测试中超越GPT-5等顶尖模型,展现强大性能。

  • 曝苹果为新Siri做了内部版ChatGPT 正测试搜索个人数据、执行App内操作等功能

    苹果公司正在开发一款类似ChatGPT的手机应用“Veritas”,用于内部测试明年将推出的新版Siri。该应用可快速评估Siri新功能,包括搜索个人数据、执行App内操作(如编辑照片)等。虽然不面向消费者发布,但该工具标志着苹果对Siri的全面升级已进入新阶段,旨在帮助员工高效完成测试。

  • 视觉中国「灵感拓展」功能完成生成式AI服务上线登记

    视觉中国旗下中华易美视觉科技公司推出的“灵感拓展”功能已通过江苏省网信办生成式人工智能服务上线登记,正式在VCG.com面向用户开放。该功能基于国产大模型,结合丰富内容资源,通过AI技术为创作者提供灵感和方向,提升创意产出效率与质量。用户可在搜索时获得智能拆解的多维度创作建议,帮助精准定位需求,突破创作瓶颈,优化素材匹配效率。该功能是视觉中国在“AI智能+内容数据+应用场景”战略下的重要成果,目前已面向合作客户开放。

  • ChatExcel重磅发布:基于AMD锐龙AI MAX+ 395处理器的数据分析Mini AI 工作站

    ChatExcel发布搭载AMD锐龙AI MAX+395处理器的Mini AI工作站,重构数据全链路,打造“找数-做数-分析数-看数-用数”的商业闭环平台。依托处理器96GB超大显存和统一内存架构,实现本地流畅运行GPT-oss-120B等大型模型,保障数据安全的同时显著提升分析效率。该方案以财务场景为例,支持多任务并行处理,将原本需1天完成的月度报表压缩至2小时,解决“数据不外发”与“高效处理”的核心矛盾。

  • 腾讯应用宝与高通(中国)基于骁龙平台共推端侧AI能力 发布AI智能启动台

    在2025骁龙峰会期间,腾讯应用宝与高通(中国)宣布合作,聚焦移动应用跨端引擎技术与端侧AI应用创新。双方推出针对搭载骁龙X系列计算平台的定制化解决方案,包括升级的跨端引擎和基于端侧AI能力的智能启动台,提升PC内容体验与生产力工具效率。跨端引擎实现安卓应用原生运行、续航超9小时、虚拟机启动仅5.5秒等性能突破,覆盖超1000款热门应用。智能启动台通过文件主题分类、本地搜索和AI服务(如发票助手)重构PC交互,降低AI调用成本并保护数据隐私。此次合作旨在完善跨端生态布局,推动端侧AI普惠化落地。

  • 让搜索“一步到位”! 快手提出端到端生成式搜索方案OneSearch

    当前电商平台普遍采用“召回、粗排、精排”级联式搜索架构,但存在商品描述混乱、相关性差、冷启动难等痛点。快手提出业界首个工业级端到端生成式搜索框架OneSearch,集成三大创新模块:关键词增强量化编码(KHQE)提升商品特征建模能力,多视角用户行为序列注入策略实现精准偏好捕捉,偏好感知奖励系统(PARS)优化排序多样性。实际部署后,订单量提升3.22%,买家数增长2.4%,在线推理成本降低75.4%,冷启动场景表现尤为突出。该系统标志着生成式模型在大规模工业场景中首次完整替代传统搜索链路,为电商搜索技术发展指明方向。

  • 续科天下发布全新XUKE TECH产品体系,为AI时代构建可靠数据基石

    续科天下发布XUKE TECH完整AI数据处理系统,推出Base、Embed、Vault三款核心产品,解决企业AI化过程中的非结构化数据处理难题。该系统能统一处理多模态数据,通过向量化转换和安全存储管理,形成端到端解决方案,帮助企业将70%的数据预处理精力转向模型开发,显著缩短AI项目上线周期,已在金融、互联网等领域验证实效。

  • 游戏行业进入拉锯战,未来3年没人能躲开这个能力

    除了《三角洲行动》可能是最大的特例 和前几年大作扎堆立项、宣发,或者新品上线即一夜爆火的热闹情况相比,如今的市场似乎颇显单调,榜单前列除了少量黑马之外,绝大部分时间都是些老面孔在角逐。 最近葡萄君和几位业内人士聊了聊,他们也颇有同感。 比如雷霆游戏的VP/CTO 生辉就表示,随着人口红利的消失、用户审美能力的快速上升,他们越来越发现:投入5亿做10

  • Reviews.ai 依托 DigitalOcean 高效实现 AI 业务扩展

    Reviews.ai是一个消费者反馈聚合平台,帮助品牌将客户评论转化为可执行的洞察。该平台专注于评论分析,通过AI驱动功能(如按需报告、主题分类和智能代理)提升产品与服务。近期从Review Monitor更名后,团队迁移至DigitalOcean云平台,解决了原有专用服务器架构的扩展瓶颈。迁移过程在合作伙伴Aquazeel支持下高效完成,仅用数周,成本降低近30%。新架构采用Droplets、托管数据库和负载均衡器,支持灵活扩展。未来计划利用GPU Droplets增强AI能力,进一步优化大型语言模型处理效率。

今日大家都在搜的词: