首页 > 业界 > 关键词  > text-to-videosynthesis最新资讯  > 正文

阿里达摩院上线文本生成视频大模型

2023-03-22 16:18 · 稿源:站长之家

站长之家(ChinaZ.com)3月22日 消息:最近,阿里达摩院在魔搭社区(ModelScope)发布了一个新的人工智能模型,可以根据用户输入的英文文本提示,自动生成对应的视频。这个模型由三个子网络组成,整体参数约17亿,采用了扩散模型的结构,通过从噪声视频中迭代去噪的过程,实现视频生成的功能。

QQ截图20230322162057.png

这个模型目前已经开放给用户试玩,只要输入一些简单的描述词,就可以看到生成的视频效果。比如输入“A panda eating bamboo on a rock”,就可以看到一只大熊猫坐在岩石上吃竹子的画面。

不过,目前这个模型还不支持中文输入,而且生成的视频长度多在2-4秒,等待时间从20多秒到1分多钟不等,画面的真实度、清晰度以及长度等方面还有待提升。

QQ截图20230322162200.png

阿里达摩院的这个发布引起了国内外网友的关注和尝试,也展示了人工智能技术在内容生成领域的进步和潜力。未来,或许我们只需要一些文字提示,就能制作出任何风格和主题的视频内容。

体验地址https://modelscope.cn/studios/damo/text-to-video-synthesis/summary)

举报

  • 相关推荐
  • AI日报:小红书发布对话合成模型 FireRedTTS-2;百度文心新模型登顶Hugging Face榜首;xAI将裁员500人

    AI日报今日聚焦七大热点:小红书发布FireRedTTS-2语音合成模型,显著提升自然度;百度文心ERNIE-4.5登顶Hugging Face榜单;谷歌Gemini应用登顶美国免费榜;马斯克xAI裁员500人并战略转型;OpenAI拟大幅降低与微软分成比例;DeepMCPAgent开源框架提升AI代理生产力;蚂蚁发布AI开源全景图2.0;北京1400多所中小学推行人工智能通识课程。

  • 基于通义万相 美图多款APP上线全新动漫特效、AI变身等视频生成功能

    今日,美图公司旗下美图秀秀、RoboNeo、Wink和开拍等多款产品,推出全新动漫特效、AI变身等视频生成功能。 据悉,新功能基于通义万相系列模型进行深度开发与训练,为美图的全球用户提供全新的创作体验。 近年来,美图加速布局生产力场景,不仅推出面向企业的AI算法服务和解决方案,旗下消费级产品也在快速集成大模型。 去年6月,美图就开始和阿里展开大模型合作。

  • DeepSeek:已对AI生成合成内容添加标识 用户不得恶意删除

    今天下午,DeepSeek发布了《关于AI生成合成内容标识的公告》。 公告中称,Deepseek始终高度重视AI的安全问题,已在平台内对AI生成合成内容添加标识,并明确提醒用户相关内容由AI生成。 此举为贯彻落实《人工智能生成合成内容标识办法》(2025年9月1日起施行)及《网络安全技术 人工智能生成合成内容标识方法》等国家标准的相关要求,防止AI生成内容可能引发的公众混淆、�

  • 从暑期档剧集TOP20,看腾讯视频的“大家底蕴”

    暑期档落幕,五味杂陈。如果以爆款指标来论,今年的暑期档剧集表现算不上优异,但市场确实又扫去了一些阴霾: 一方面,恰逢暑期档发布广电21条,切切实实提振了行业信心。另一方面,则是在暑期档内容里,我们看到了更多的“确定性”——这个词在今年的长剧市场频繁被提及,它被视为内容行业穿越周期、应对市场不确定性的关键,如今也是新政落地、长剧市场乘风的

  • AI日报:快手推出AI视频制作助手Kwali;字节跳动推出USO模型;OpenAI推出ChatGPT开发者模式

    本文介绍了AI日报栏目,聚焦AI领域最新动态。快手推出Kwali视频助手,简化视频制作流程;字节跳动发布USO模型,解决图像生成中风格与主题的矛盾;微软推出Copilot Audio音频模式,提供个性化语音交互;Stability AI升级Stable Audio 2.5,支持高质量音频生成;阿联酋推出开源大模型K2 Think,拥有320亿参数;微信上线智能回复功能,提升公众号运营效率;OpenAI推出ChatGPT开发者模式,支持AI控制外部工具;字节跳动Seed团队发布AgentGym-RL框架,提升语言模型决策能力;月之暗面开源Checkpoint Engine中间件,优化LLM推理效率;B站开源IndexTTS-2.0文本转语音系统,支持情感与时长控制;Replit推出Agent 3编程助手,自主性提升10倍。

  • VTN平台:向TRUTH原则致敬,携手消费者重识健康真相

    在信息过载的大健康消费市场,VTN平台以“TRUTH原则”为核心,通过全面、实际、有用、信任与和谐五个维度,为消费者构建科学健康认知体系。平台甄选全球优质健康品牌,依托前沿科技与深度服务,提供个性化健康方案,致力于推动健康消费从交易型向价值型跃迁,实现个体与社会的健康和谐。

  • Leader专注做爆款:小音浪F7热水器上市就成TOP1

    Leader统帅小音浪F7热水器凭借精准语音交互功能成为行业标杆。产品搭载离/在线双模式语音系统,支持5000条离线指令和10万条在线指令,语音识别准确率高达99%,能听懂多种方言。配合QQ音乐、喜马拉雅曲库,提供丰富音乐内容。同时采用原创小白瓶净肤科技,过滤杂质预防水垢,打造健康沐浴体验。该产品上市即成为爆款,销量突破京东电热水器首发纪录,实现站内行业销量销额TOP1,重新定义智能热水器标准。

  • B站为何需要视频播客?

    ​最近,内容平台最大的风莫过于视频播客了。 各大平台纷纷发力,竞相涌入这一新赛道。其中,B站则重磅推出《视频播客出圈计划》,吸引了于谦、鲁豫、蔡明、罗永浩、杨迪等众多名人入驻,各类媒体播客也相继加入战局。 从扶持力度上和势头上看,B站无疑将视频播客视为下一个重点发力领域。那么,B站为何需要视频播客?它又能否成为B站新的品牌IP?

  • 全球图生视频榜单第一,爱诗科技PixVerse V5如何改变一亿用户的视频创作

    好玩好用的明星视频生成产品再更新,用户操作基础,模型技术就不基础。 熟悉生成领域的读者们最近都被谷歌的一只纳米香蕉 nano-banana 刷了屏。 在图像生成领域,纳米香蕉在短期内获得了巨量的影响力,凭着「照片变手办」的超高真实感的创意玩法横扫整个社交媒体,尤其触动了毛孩子家长们的心。

  • 腾讯视频暑期档短剧全域领跑,定义精品短剧新高度

    今年上半年,腾讯视频短剧以全方位领先姿态持续领跑行业:全域声量突破400亿,斩获全网热搜超700个,并在分账票房、用户互动、口碑热度等多维度实现全面领跑,展现出平台在短剧领域的系统化布局与生态级能力。进入暑期档,该势头全面爆发,多部精品短剧不仅斩获高分账票房,更在用户互动、话题发酵与榜单占位上多维开花,进一步夯实了腾讯视频短剧的行业标杆地位�

今日大家都在搜的词: