首页 > 传媒 > 关键词  > 视频生成最新资讯  > 正文

昇腾算力赋能视频生成革命 浙江大学团队攻克长时一致性难题

2025-07-31 16:48 · 稿源: 站长之家用户

随着以 Sora 为代表的视频生成模型技术的演进,长视频生成领域在维持长时序内容一致性以及平衡生成质量与计算资源效率方面面临挑战。浙江大学 鲲鹏昇腾科教创新卓越中心计算机学院研究员朱霖潮团队基于此课题持续深耕并取得重要进展。依托昇腾AI基础软硬件平台,该团队提出的技术方案有效提升了长视频内容一致性,同时显著优化了视频生成过程中的计算效率。

针对长序列视觉指令生成的核心技术难题,项目团队成功研发首个无需训练的长序列视觉指令生成框架LIGER,实现了历史提示和视觉记忆机制,以及基于DDIM反演的记忆校准技术。依托昇腾的编码加速能力,通过对每个步骤的图像特征进行采样和存储,捕捉前序步骤中的关键视觉信息,并将其注入到自注意力机制中,确保步骤间的视觉连贯性。同时,通过自反思机制纠正图像中的属性错误、逻辑错误、对象冗余和身份不一致等问题,使用多种图像编辑工具进行精确修正。该系统在长序列任务中展现出优异的逻辑连贯性和对象属性准确性,显著提升了视觉指令的理解性和实用性。

在计算效率方面,项目团队提出了基于昇腾平台优化的引导式渐进蒸馏方法,通过在线教师引导、渐进式蒸馏和高频细节保护三项关键技术,成功加速了视频扩散模型的生成过程。该方法让教师模型实时优化学生模型的中间预测以创建自适应训练目标,通过多阶段训练逐步增加步长将复杂轨迹学习分解为可管理的任务,并引入频域损失函数保持视频精细细节。在保持视频高质量输出基础上,该方法实现8倍加速。

该项目创新性地将大语言模型推理能力与视频生成技术相结合,为多模态交互研究开辟了新方向。目前,研究成果已成功入选人工智能顶级会议ICLR2025,获得国际学术界的高度认可。项目构建的包含569个任务的评估数据集,为后续研究提供了重要基准。

未来,浙江大学 鲲鹏昇腾科教创新卓越中心将依托昇腾AI基础软硬件平台,持续深化产学研协同创新,着力突破多模态生成技术的核心瓶颈,构建自主创新、技术领先的多模态生成技术生态体系,并为国家人工智能战略与数字经济发展储备核心创新力量。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 长视频,要MCN化?

    过去十多年,长视频平台习惯用头部综艺与大剧撬动增长:内容够强,自然破圈,声量带动会员与广告。 这套“内容中心逻辑”曾行之有效。 但短视频重写了注意力分配。用户不再愿意投入整段时间追一个叙事,三十秒的情绪刺激就足以满足娱乐需求。内容生命周期被压缩,哪怕是重金制作,也可能上线当周见顶、难以延展。 在这种环境下,平台不得不寻找新的增长方式。�

  • 豆包-应用生成·「一点都不技术」创作挑战赛开赛!

    英特尔联合豆包-应用生成发起“一点都不技术”创作挑战赛,旨在通过零代码AI工具降低创意门槛。用户只需输入一句话或一张图,即可在5分钟内生成网页、工具或小游戏等多样化作品。赛事设置总价值20万元奖励,包含现金及火箭发射观礼等特色福利,并构建“创作-交流-成长”的完整生态,推动AI技术普惠。活动将持续至2025年12月8日,让每个平凡创意都有机会落地生花。

  • NuwaAI V1.0发布!一句话生成数字人,全面升级数字生产力

    在2025年中国国际高新技术成果交易会上,邦彦技术股份有限公司发布NuwaAI V1.0,实现"一句话生成可执行任务的数字人"核心功能。用户通过自然语言指令即可生成具备身份设定、表达能力和完整任务执行流程的数字人,覆盖教育、商业、媒体等场景。该系统支持自动规划内容结构、协调节奏,并能执行发布会主持等全流程工作,标志着数字人从"内容展示"向"任务执行体"的重要转变,为行业提供可持续的生产力工具。

  • 爱诗科技下注的AI视频,正在比它预期的更「快」落地

    「我们决定全力投入视频生成领域,因为我们坚信视频生成一旦能够落地,其产品化和商业化的潜力可能不亚于大语言模型。」爱诗科技创始人兼CEO王长虎在2025年6月的一场演讲中,这样解释为什么要在2023年就坚定地选择AI视频生成这个非共识赛道作为自己的创业方向。 短短两年后,视频大模型的产品化和商业化潜力已经如王长虎判断的那样,在快速落地,形成自己的创作生�

  • 百度搜索AI API全面开放 绝大多数结果由AI生成

    11月13日,百度创始人李彦宏在2025百度世界大会上宣布,百度搜索已实现绝大多数结果由AI生成,首条结果富媒体覆盖率高达70%。他强调,百度正通过AI技术深度重构搜索结果页,从传统文字链接模式转向以图片、视频等富媒体内容为核心的AI应用。李彦宏指出,百度是全球搜索引擎中对AI化改造最激进的,正引领行业进入全新时代。他还表示,企业需善用AI方能立于不败之地,个人也需掌握AI技能以掌控未来。目前,百度已通过AI+API开放搜索能力,与三星、荣耀、vivo等主流厂商建立合作,共同探索AI搜索的无限可能。

  • geo生成式引擎优化是什么?GEO优化原理与工具推荐

    在AI技术日新月异的今天,我们的信息获取方式正经历着一场革命。生成式引擎优化(Generative Engine Optimization,简称GEO)是AI搜索时代应运而生的新型优化策略,它被视为传统SEO在AI时代的进化版。 与传统SEO专注于提升网页在搜索引擎结果中的排名不同,GEO的核心目标是让品牌信息能够被DeepSeek、豆包、文心一言等主流AI平台识别、引用并直接推荐给用户。这种转变是因为搜索�

  • 得一微 UFS存力主控荣获年度中国半导体优秀产品,加速手机生成式AI普及

    在2025年第八届中国IC独角兽论坛上,得一微电子UFS3.1存力主控芯片YS8803荣获"2024-2025中国半导体优秀产品"奖。作为中国大陆首款面向公开市场的UFS3.1主控,该芯片支持高达2150MB/s读取和2000MB/s写入速度,专为AI参数模型优化,显著缩短大模型加载时间,推动生成式AI在移动端普及。得一微电子通过存储控制、存算互联等技术创新,持续赋能高端手机市场,助力构建自主国产AI存力生态。

  • 从SEO到GEO的范式革命,《生成式AI时代 品牌战略指南》白皮书正式发布

    11月4日,《生成式AI时代+品牌战略指南》白皮书发布,聚焦企业AI搜索优化需求。白皮书提出GEO全链路解决方案,结合E-E-A-T信任框架和3C指导法则,帮助企业破解AI搜索覆盖率低、合规风险高等痛点,推动从流量竞争转向价值竞争,构建可持续增长生态。

  • AI生成式引擎优化选择哪个平台好?GEO优化工具推荐

    在数字化浪潮席卷的当下,品牌如何在AI平台中脱颖而出,成为众多企业关注的焦点。要理解这一点,我们首先需要认识一个新兴的营销策略——GEO。 GEO,全称为生成式引擎优化(Generative Engine Optimization),其核心目标是让品牌内容能够被AI搜尋工具理解、引用和推荐,最终被纳入AI生成的答案中。这与传统的SEO(搜索引擎优化)专注于在搜索结果列表中排名靠前有着本质的不同�

  • GEO生成式引擎优化怎么做?GEO监控工具推荐

    文章探讨产品在AI问答中曝光不足的问题,指出传统SEO思维已过时,需转向生成式引擎优化(GEO)。GEO核心是让AI模型在回答时主动引用品牌,而非仅追求搜索排名。作者通过AIBase工具监控发现,产品描述过于技术化导致AI无法理解,调整文案后曝光翻倍。预测到2026年,传统搜索流量将降25%,AI问答成为主流入口,建议主动优化而非被动等待。

今日大家都在搜的词: