首页 > AI头条  > 正文

腾讯混元视频模型(Hunyuan Video)测试招募中,开源在望

2025-02-24 09:47 · 来源: AIbase基地

近日,腾讯混元视频模型(Hunyuan Video)在 X 平台上正式公开招募测试伙伴,标志着这一前沿 AI 视频生成技术迈入关键测试阶段。根据官方透露,测试结束后,该模型有很大概率会开源,为全球 AI 社区贡献其技术成果。

QQ20250224-093301.png

混元视频模型是腾讯在 AI 视频生成领域的重要创新,拥有超过13B 的参数量,是目前开源模型中规模最大的视频生成模型之一。其核心技术包括高效的时空上下文建模能力以及对复杂物理规律的精准模拟,能够生成高质量且符合真实世界逻辑的视频内容。

QQ20250224-094643.png

此前,腾讯混元团队曾表示,该模型在测试阶段已展现出超越当前最先进模型的性能表现,尤其是在视频流畅性、细节还原以及多对象生成等方面表现突出。

此次公开招募测试伙伴,旨在通过与开发者、企业和研究机构的广泛合作,进一步提升模型的性能与适用性。参与测试的伙伴将有机会优先体验 Hunyuan Video 的强大功能,并为其优化提供宝贵反馈。

腾讯表示,测试伙伴的参与将成为模型开源前的重要环节,确保其在多样化场景中的稳定性和实用性。承诺。根据官方预告,测试结束后,Hunyuan Video 有很大概率会开源。

招募地址:https://docs.google.com/forms/d/e/1FAIpQLScZe9DflcpKf_JfcgGnAiXfyhEZAt2uP4mE0Rhs5l9R2m49oA/viewform

  • 相关推荐
  • AI日报:腾讯混元推3D生成大模型Hunyuan3D-PolyGen;钉钉AI表格重磅来袭;阿里推多模态大语言模型HumanOmniV2

    本文介绍了AI领域多项重要进展:1)腾讯推出首个美术3D生成大模型Hunyuan3D-PolyGen,显著提升建模效率;2)阿里发布多模态大模型HumanOmniV2,准确率达69.33%;3)钉钉AI表格实现1小时处理千项任务;4)百度PaddleOCR3.1版本在多语种识别和文档翻译方面升级;5)微软推出Deep Research智能体,自动化研究流程;6)香港理工与OPPO联合开源视频超清框架DLoRAL;7)谷歌开源MCP工具箱简化AI与数据库集成;8)Win11将推出AI动态壁纸功能。这些创新展示了AI在3D生成、多模态理解、办公效率、视觉处理等领域的突破性进展。

  • 首部菁彩Vivid影片震撼上映,视效革命点亮东方幻境

    7月12日,动画电影《聊斋:兰若寺》以菁彩Vivid/HDR+LED版本登陆暑期档。该片由《长安三万里》原班人马打造,采用尖端视效技术呈现东方志怪美学,突破传统SDR技术局限,实现更高动态范围和广色域表现。特别版在适配影院独家放映,通过显著明暗对比、丰富色彩层次和通透画面质感,极大增强观影真实感和沉浸感。影片改编自蒲松龄经典名著,以视觉技术精准呈现人物微表情和场景细节,深化情感共鸣。该技术突破将推动影视产业生态创新发展,为观众带来颠覆性视听体验。

  • 腾讯视频上线“超高清内容”专区:4K/60帧 支持HDR Vivid

    近日,腾讯视频推出超高清内容”专区,集纳平台400余部超高清内容,涵盖电视剧、电影、纪录片、综艺、动画片、微短剧等品类,在各端进行重点推荐。 腾讯视频超高清方案命名为臻彩”,这是腾讯视频超高清的代表性技术。 2025年1月,腾讯视频自研超高清视听品牌臻彩”的高阶版本臻彩MAX”正式推出,主打极致画质与沉浸式观影体验。

  • AI日报:智谱上线PPT生成功能AI Slides;可灵 AI 发布可图2.1模型

    本文介绍了AI日报栏目及近期AI领域多项突破性进展:1)智谱推出免费AI Slides工具,基于GLM模型快速生成高质量PPT;2)可灵AI发布可图2.1模型,支持180多种风格图像生成;3)NVIDIA推出DiffusionRenderer技术,实现视频到可编辑3D场景转换;4)墨刀AI新增30秒生成高保真原型功能;5)Higgsfield推出Soul ID工具,10张照片即可生成虚拟形象;6)谷歌DeepMind开源GenAI Processors工具库;7)谷歌Veo新增图像转视频功能;8)Mistral AI发布专为代码建模的Devstral2507系列模型。这些创新展示了AI在内容生成、3D建模、产品设计等领域的快速发展。

  • A日报:B站升级动漫视频生成模型AniSora V3;字节开源4D视频生成框架EX-4D;DeepSWE开源AI Agent系统强势登顶

    AI日报栏目汇总了近期AI领域的重要进展:1)字节跳动开源EX-4D框架,可将单目视频转换为多视角4D视频;2)B站开源动漫视频生成模型AniSora V3,支持多种风格;3)DeepSWE+开源基于Qwen3-32B的AI Agent系统;4)字节开源3亿参数图像编辑模型VINCIE-3B;5)Stability AI推出移动端音频生成模型Stable Audio Open Small;6)谷歌发布免费教育AI工具套件Gemini for Education;7)Topview推出革命性AI数字人带货技术Avatar

  • A日报:月之暗面开源大模型Kimi K2;智源全面开源RoboBrain2.0;通义千问发布Qwen Chat桌面客户端

    本期AI日报重点报道了多项AI领域突破性进展:1.月之暗面推出万亿参数开源大模型Kimi K2,展现强大智能能力;2.智源研究院开源RoboBrain2.0和RoboOS2.0机器人系统;3.通义千问发布桌面客户端Qwen Chat;4.IndexTTS2实现影视级语音合成;5.HuggingFace开源机器人Reachy Mini热销;6.Meta推出实时视频生成模型StreamDiT;7.PixVerse新增多关键帧视频生成功能;8.特斯拉推出仅支持AMD处理器的Grok AI助手;9.OpenAI推迟开源大模型发布以加强安全测试;10.Liquid AI开源边缘AI模型LFM2;11.AI"时间穿越"特效在社交媒体走红。

  • AI日报:阿里通义开源音频生成模型ThinkSound;谷歌Veo3支态图片生成视频;昆仑万维发布 Skywork-R1V 3.0

    【AI日报】今日AI领域重要动态:1)阿里开源支持链式推理的音频生成模型ThinkSound,实现高保真空间音频生成;2)谷歌Veo3升级,支持静态图片生成生动视频;3)Hugging Face发布30亿参数小模型SmolLM3,性能优于Llama-3.2-3B;4)阿里开源网络智能体WebSailor,展现强大推理和检索能力;5)Moonvalley发布原生1080P视频生成模型Marey Realism v1.5;6)Vidu Q1支持最多七张参考图像生成一致性视频;7)苹果�

  • 马斯克xAI推出Grok - 4 大模型将至,Meta/微美全息深耕开源AI融合加速

    埃隆·马斯克旗下xAI即将发布Grok-4大模型,该模型将在语言、数学和推理方面超越OpenAI和谷歌最新AI产品。同时苹果低调收购两家AI公司TrueMeeting和WhyLabs,加速布局Vision Pro头显和Apple Intelligence领域。Meta计划投入数百亿美元扩建AI基础设施,扎克伯格亲自招募顶尖AI人才。微美全息聚焦高性能算力与多模态模型,推动AI产业升级。当前AI赛道竞争激烈,大模型正向通用多模态演进,商业化落地成为关键。

  • 三下乡投稿视频媒体平台|学习 强国央视频人民视频投稿

    文章介绍了高校如何在权威媒体平台高效投放宣传视频的三大推荐渠道:1)"学习 强国"平台,适合党政类内容;2)央视视频平台,作为国家级5G新媒体平台;3)人民日报旗下人民视频。建议通过第三方服务机构【猎媒传播】投稿,可1-3天快速审核发布。视频要求MP4格式,大小不超过200M,时长1-3分钟,可配300-500字简介。

  • 苹果《F1》狂飙,阿里腾讯学不会

    在高举高打进入影视行业6年之后,《F1:狂飙飞车》(以下简称《F1》)终于让苹果公司尝到了一次豪赌成功的滋味。 这部投资+宣发费用3.5亿美金的F1赛车电影全球票房已经接近5亿美金,成为苹果公司票房最高的一部。在国内市场,《F1》也是暑期档的一匹黑马,上映22天累计票房达2.82亿元人民币。IMAX票房尤其表现出色,成为今年唯二过亿的电影,另一部是《哪吒之魔童闹海�

今日大家都在搜的词: