首页 > 业界 > 关键词  > 视频生成最新资讯  > 正文

马斯克炫酷变身毒液!实测通义Wan2.1首尾帧视频模型,还能“拼接”经典梗图

2025-04-21 08:58 · 稿源:量子位公众号

在GitHub狂揽1w+星标的通义万相Wan2.1,又双叒上新了!最新打开方式是酱婶儿的:给出开始(首帧)和结束(尾帧)两张图片,Wan2.1便能分分钟生成一段丝滑的5s、720p视频。根据前后视角的不同,还能自动调整镜头角度,缓慢变成高空俯拍,并同时保证人物光影正确:原来这是阿里通义万相Wa

......

本文由站长之家合作伙伴自媒体作者“量子位公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • AI日报:豆包视频1.0pro fast发布;谷歌Gemini新功能上线;百度推上体体育大模型 2.0

    本期AI日报聚焦多项技术突破:火山引擎发布豆包视频生成模型1.0pro+fast,速度提升3倍且价格下降72%;百度与上海体育大学推出“上体体育大模型2.0”,拓展AI在运动员训练等场景应用;谷歌Gemini新增一键生成PPT功能;美团发布LongCat-Video模型,支持5分钟连贯视频生成;xAI推出虚拟女友Mika引发热议;MiniMax开源高性能M2编码模型;OpenAI上线企业知识管理功能;另报道20岁辍学生开发的AI笔记工具Turbo AI半年用户破500万,展现年轻创业者的技术影响力。

  • 小米17 Pro系列妙享背屏全新掌机游戏等新功能上线

    小米14 Pro系列10月29日迎来副屏重大更新,新增动态大头贴、实时对话翻译功能,并上线5款动态壁纸及2款复古风格掌机游戏。动态大头贴支持通过副屏拍摄并应用模板增添趣味,对话翻译实现正屏输入与副屏多语言同步显示。壁纸库新增萌系与科技自然主题,掌机游戏搭配专属保护壳提升沉浸体验。此次更新分阶段推送,预计11月中旬覆盖全部用户,持续拓展副屏交互场景。

  • 小米17 Pro系列妙享背屏新功能上线:包括对话翻译、新游戏等

    小米17系列妙享背屏功能将于10月29日正式上线,包含四大亮点:动态大头贴支持拍摄生动瞬间并新增明亮风格模板;对话翻译实现正屏输入、背屏即时显示译文;新增动态壁纸提升界面趣味性;配合游戏手机壳可畅玩《愤怒的小鸟》等经典游戏。该背屏还支持倒计时、音乐控制等实用功能,尺寸设计合理,投入超10亿元研发,体现小米对用户体验的重视。

  • 苹果悄然在iOS 26.1中引入新功能:第三方App可以后台备份照片了!

    苹果在iOS 26.1中引入用户期待已久的后台自动备份照片功能,允许第三方应用在后台自动上传图像。此前,Google相册、OneDrive等应用因系统限制只能在应用活动时上传,导致备份中断、体验糟糕。新功能通过PhotoKit框架支持,引入后台资源上传扩展协议,确保应用未活动或设备锁定时也能持续上传。系统会控制功耗和网络访问以保障备份一致性和电池效率。开发者需完成配置扩展目标、处理上传任务等步骤来集成此功能,部分操作需用户明确同意。

  • 00后担大梁交大本科生在计算机安全顶级会议上实现突破,打造大模型全方位安全分析底座

    上海交大本科生徐菲悦为第一作者的论文《大型语言模型鲁棒性与对齐的多维评估框架》被IEEE S&P 2026录用。该研究提出“安全魔方”评估体系,构建覆盖攻击、防御与判定三大维度的多指标框架,系统化刻画LLM安全性,新增攻击稳定性、跨模型迁移性等关键度量,弥补传统单一指标不足,为研究比较、安全基线制定及监管审查提供可操作的通用量表。

  • 国内大模型GEO优化全攻略:免费工具教你监测品牌在文心一言、通义千问等AI平台的可见度

    AI搜索时代,品牌若未出现在AI回答中就等于"不存在"。GEO(生成引擎优化)成为新战场,核心是让AI在回答用户问题时优先引用企业内容。文章详解国内主流AI模型特点:文心一言整合百度生态、通义千问依托阿里电商数据、小众模型在垂直领域更易被引用。提出三大优化策略:内容结构化呈现、建立行业权威背书、布局高权重平台。推荐使用AIBase免费工具实时监测品牌在各大AI平台的曝光情况,通过数据驱动优化策略。

  • Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

    SoulX-Podcast语音生成模型在开源社区Hugging Face发布次日登顶TTS趋势榜。该模型由Soul AI Lab联合高校团队开发,专为多轮对话场景设计,支持中英川粤等多语言/方言与副语言风格,能生成超60分钟流畅自然、角色切换准确、韵律丰富的语音。它解决了传统语音系统在多轮对话中上下文衔接不自然、缺乏副语言控制能力等痛点,在播客、语音合成等场景表现突出,获开发者广泛关注。Hugging Face CEO也转发相关内容,团队未来将持续优化语音对话、拟人化表达等核心交互能力,深化开源生态建设。

  • 更新功能、内测新App,抖音快手再战社交

    ​抖音和快手又一次向社交领域发起进攻。 近日,抖音、快手在站内密集更新了“日常”“说说”等一系列社交新功能;此外,抖音还被曝正在内测全新的社交App。 当流量增长触及天花板,内容的稀缺性逐渐变弱,社交似乎成为了短视频巨头的“新叙事”。 它们为何始终对“社交”念念不忘?这究竟是构筑护城河的必然选择,还是一场注定艰难的豪赌?

  • 特斯拉全新功能上线:氛围灯会随音乐跳舞

    特斯拉通过2025.26版OTA更新推出“音彩光舞”功能,让车内灯光随音乐律动,提升座舱氛围,还支持锐舞洞穴等玩法及专辑封面颜色匹配。同时上线“车鱼视听”应用,可登录抖音账号浏览视频、收听头条新闻,并支持Apple Music百首以上播放列表随机播放及自定义音频均衡器预设,优化听觉体验。此次升级大幅提升了座舱娱乐体验。

  • Sora App的AI视频社交,给了百度们新希望

    Sora2发布两周后,百度的蒸汽机AI视频模型,和谷歌Veo3.1撞了档期。 两家公司选择同期发布并非有多默契,而是Sora2带来的压迫感促使它们不得不加快脚步。 奥尔特曼将形容Sora2为“创意领域的ChatGPT3.5时刻”,不仅在物理逻辑、画面连贯性、真实感和音画同步等方面实现了质的飞跃,还把Sora从一个“文本到视频”的工具进化成一个“创意到生态”的平台。 这无疑是扔在AI视�

今日大家都在搜的词: