首页 > 业界 > 关键词  > 阿里巴巴最新资讯  > 正文

阿里开源通义新模型:指定首尾图片生成视频

2025-04-18 11:31 · 稿源: 快科技

快科技4月18日消息,据报道,阿里巴巴旗下通义万相宣布开源其创新视频生成技术首尾帧生视频14B模型。

这项突破性AI技术能够根据用户提供的起始和结束画面,智能生成720p高清过渡视频,为视频创作带来全新可能。

该模型通过先进的深度学习算法,能够精准理解输入画面的内容、风格及主题特征。当用户提供首尾两帧图像后,模型会智能分析画面中的视觉元素,包括物体形态、色彩构成和光影变化等,进而推理出最合理的中间过渡帧。

这使得生成的视频不仅能够保持物体运动轨迹的自然连贯,还能实现光线和色彩的平滑渐变,最终输出具有高度逻辑性的流畅视频。

目前,这项创新技术已面向公众开放。用户可以直接访问通义万相官网进行免费体验,也可以通过GitHub、Hugging Face或魔搭社区获取开源代码,支持本地部署和二次开发。

这项技术特别适用于需要精准控制过渡效果的视频创作场景,如延时摄影、特效变身等,为内容创作者提供了更高效、更可控的AI视频生成解决方案。

举报

  • 相关推荐
  • 跻身全球第一梯队!京东开源JoyAI-Echo框架:解决长视频生成三大难题

    今日,京东宣布推出JoyAI-Echo长音视频生成框架,号称解决行业长期头疼的长视频生成三大难题:角色易崩、声音乱变、生成缓慢。 目前,JoyAI-Echo代码与权重已全部开源,项目页和GitHub代码仓库均已上线,开发者和创作者可进行体验和二次开发。 京东表示,JoyAI-Echo的推出,标志着京东在长视频生成领域实现重大突破,进入全球第一梯队。 据了解,JoyAI-Echo内置跨模态音视频�

  • sora正式停服,国内版天空AI视频生成模型发布

    Sora宣布停服后,国内“天空AI”视频生成大模型正式发布。该模型由温州专帮信息科技推出,支持文本、图片生成逼真视频,核心亮点是用户无需GPU服务器,用家庭或办公电脑即可完成算力,成本几乎为零。目前发布三个版本:手机版、单机版和多用户商用版,并支持OEM贴牌、私有化部署等技术服务,实现低成本、高效率的视频创作。

  • 受邀走进阿里巴巴总部,GEO理论奠基人罗小军为百余位跨境商家讲授GEO实战方法论

    2026年5月25日,阿里国际站浙江大区AI先锋营在杭州开课,猛犸AI创始人罗小军受邀主讲,为100余位跨境电商企业家系统讲解AI时代跨境经营的底层逻辑与实战路径。培训涵盖理论、实操与核心操作,指出外贸进入A2A时代,算力含量决定企业竞争力。罗小军重点解析GEO内容体系,强调品牌内容被AI采信的关键要素,并给出30天完成AI化经营基础搭建的行动指南。

  • 男子用AI写歌月入十几万:40秒就能生成一首歌

    近日,浙江杭州一名从业者借助AI音乐创作工具实现可观收益。该创作者只需上传一张图片,耗时40秒便能生成一首完整曲目,工具可驾驭各类曲风,生成作品的人声、唱腔还原度贴近真人演唱,普通听众很难区分演唱者是AI还是真人。 依托低成本批量制作AI歌曲,投放到音乐、短视频平台变现,月收入可达十几万元,AI生成音乐也逐渐在各大内容平台收获流量。 同时他提醒大

  • 全量机型推送!荣耀与微信首个A2A合作上线:一句话发消息、视频电话

    今日,荣耀宣布,荣耀与微信首个A2A合作成果落地,目前已面向荣耀全量机型推送。 升级后,荣耀YOYO可支持一句话调用微信,完成发送微信消息、拨打微信语音电话、视频电话等操作。 据介绍,该功能基于A2A技术方案实现。 荣耀用户只需将系统、YOYO智能体和微信升级至最新版本,打开荣耀YOYO后,即可通过一句话调起微信,为指定联系人发送消息,或发起语音、视频通话�

  • 闯视频赛道,小红书动真格了

    5月26日晚,杭州太阳剧场的颁奖台上,一位英国教授的名字出现在大屏幕上。 他叫Alan Macfarlane,已经84岁,是剑桥大学社会人类学系荣休教授,研究领域横跨英国巫术史、尼泊尔社会、现代世界起源。他参赛的视频毫不“流量向”,没有三分钟抓人眼球的叙事,没有精心设计的剪辑节奏,开头只是用略带口音的中文道一句“你好”,然后娓娓讲述关于文明、历史或人类社会的�

  • 日本熊袭击人清晰视频流出:工人被狂追后扑倒在地

    当地时间6月2日上午,日本福岛钢铁厂的监控视频记录下一头亚洲黑熊袭击人类的过程,当天它先后袭击了工厂两名男性员工、附近住宅的一名80多岁女性,以及另一家公司一名60多岁男性。 监控画面显示,这头黑熊在工厂入口穷追一名20多岁的工人,虽然工人已经绕着圈子闪躲,但最终还是不敌,被黑熊扑倒在地,好在有人驾驶一辆汽车驱赶,这才将黑熊给吓退,否则后果怕�

  • 2026厦门生成式搜索GEO优化哪家好?福建AI搜索优化GEO公司推荐

    想象一下:你的目标客户正通过DeepSeek咨询“2026年性价比最高的办公软件有哪些”,而你的产品完全符合条件,却从未出现在AI的回答中。更令人担忧的是,你可能对此一无所知,因为传统的SEO排名工具无法监测到这个“隐秘的角落”。 这个“隐秘的角落”,就是由生成式AI构建的新流量世界。衡量品牌在这个世界中的可见度,正是GEO(Generative Engine Optimization,生成式引擎优化�

  • 微信正与手机厂商合作推出A2A助手:可语音发消息、视频通话

    微信正在与华为、荣耀、小米、OPPO、vivo等手机厂商合作推出A2A(Agent-to-Agent)助手能力,可通过手机语音助理发起微信的音视频通话,或向好友发送消息。 目前,荣耀部分机型已经支持该功能,把YOYO智能体和微信更新到最新版本,即可唤醒YOYO直接语音下达指令,比如语音发微信消息、拨打微信语音、视频通话。 A2A为跨应用智能体通信标准,打破APP生态壁垒,运行逻辑为手�

  • 小米发布MiMo-V2.5-Pro-UltraSpeed:生成速度提升10倍!突破1000 tokens/s

    小米联合TileRT推出MiMo-V2.5-Pro-UltraSpeed,基于万亿参数大模型,在单台标准8卡GPU节点上首次将文本生成速度提升至1000+ tokens/s,峰值可达1200 tokens/s,无需定制专用芯片,大幅降低极速AI推理门槛。该版本同步上线运时API服务,定价为原版的3倍但速度提升约10倍,性价比突出。服务采用申请制,6月9日至23日开放试用,企业及开发者优先,普通用户可免费体验对话功能。性能飞跃依赖三大技术创新:FP4量化技术、DFlash区块并行预测解码和TileRT推理系统,重塑了AI应用场景,支持模型并行推演、自主纠错等,缓解代码生成等待,赋能高频交易、实时反欺诈等毫秒级决策场景。

今日大家都在搜的词: