首页 > 业界 > 关键词  > 大模型最新资讯  > 正文

视频生成大模型红毯结束,正戏开锣

2024-10-08 17:47 · 稿源: 窄播公众号

这是《窄播Weekly》的第31期,本期我们关注的商业动态是:AI视频生成大模型。今年2月OpenAI通过Sora的发布,为AI视频生成明确了依靠DiT(Difffusion Transfomer)架构获得突破的技术路径。随后,快手、阿里巴巴、字节跳动、美图、生数科技、智谱AI、MiniMax纷纷入局其中,持续提升着

......

本文由站长之家合作伙伴自媒体作者“窄播公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 字节跳动旗下火山引擎发布视频生成大模型Seedance2.0

    字节跳动旗下火山引擎近日发布的视频生成大模型Seedance2.0,凭借“导演级”创作能力引发全球AI圈震动。这款在1.5Pro版本基础上迭代升级的模型,不仅攻克了人物一致性、视听同步等长期困扰行业的难题,更通过自动生成专业镜头切换功能,被业内人士评价为“可能抢走专业导演饭碗”的突破性产品。

  • 大模型六小龙告别青春期

    ​不到一个月的时间,大模型六小龙中的五家都集中进行了新一轮的战略表态。 月之暗面今天发布了新模型Kimi2.5,其创始人杨植麟在2025年12月31日发布了一封全员信,公开公司完成新一轮5亿美元融资,并表示会让Kimi成为一个「与众不同」和「不被定义」的大语言模型。1月26日,阶跃星辰公布了超50亿B+轮融资,并宣布前旷视科技创始人印奇出任公司董事长,明确押注AI与智能�

  • AI日报:可灵3.0发布;阿里大模型品牌正式更名为千问;Mistral AI 发布 Voxtral Transcribe 2 语音模型

    本期AI日报聚焦多领域进展:可灵AI 3.0发布,开启15秒视频AI导演时代;阿里AI品牌统一为“千问”,战略升级;Mistral AI推出低延迟语音转文字模型;上海AI实验室发布全球最大开源科学多模态模型“书生Intern-S1-Pro”;谷歌Gemini月活用户突破7.5亿,并推出低价订阅方案;华为Mate 80系列新增AI消除屏幕摩尔纹功能;米兰冬奥会将启用阿里“千问”大模型;我国生成式AI用户规模破6亿,普及率超四成,算力水平全球领先。

  • AI日报:宇树开源UnifoLM-VLA-0大模型;腾讯“元宝派”内测截图泄露;Clawd更名为OpenClaw

    本期AI日报聚焦具身智能与AI应用新动态。蚂蚁集团发布LingBot-VLA模型,实现双手机器人通用操控;宇树开源UnifoLM-VLA-0模型,为机器人注入物理常识。开源AI助手OpenClaw更名后受关注,强调隐私安全。商汤开源SenseNova-MARS模型,在多个榜单超越GPT-5.2。腾讯“元宝派”社交功能内测截图泄露,整合微信与QQ好友,支持同步观影听歌。马斯克计划明年推出高度个性化AI生成游戏与影音内容。Anthropic因涉嫌大规模盗版遭音乐出版商起诉,索赔30亿美元。字节与阿里在春节前后发布新一代大模型,争夺云端主导权。

  • AI日报:字节发布超强视频模型Seedance2.0;小红书秘密研发AI剪辑器OpenStoryline;神秘AI模型“Pony Alpha”曝光

    本期AI日报聚焦多领域进展:字节跳动发布视频生成模型Seedance2.0,显著降低视频制作门槛;小红书研发AI视频剪辑工具OpenStoryline,支持对话式编辑;千问APP推出免单卡功能,便利年货采购;顶级域名AI.com以7000万美元成交,刷新历史纪录;神秘模型Pony Alpha因高性能免费引发关注,身份存疑;OpenAI首款AI硬件“Dime”智能耳机曝光,预计2026年发布;苹果CarPlay将支持第三方语音助手,提升交互体验;阿里新一代开源模型Qwen3.5代码现身,或为原生视觉语言模型,即将发布。

  • 花3000元让AI改口,大模型的尽头是广告?

    大模型界的翘楚OpenAI,面对每年数十亿美元的研发成本,正迎来一个艰难的决定:其员工正在琢磨如何让 ChatGPT 在用户提出相关问题时,优先显示赞助内容。 也就是说,当用户让大模型推荐一家眼镜店、一款工业传感器、一家民宿时,很可能大模型给出的是企业的软广。但大模型本身可能并不知道答案被“精心设计”过,它依然兢兢业业,会根据各个指标筛选出你想要的产品�

  • 字节跳动即梦AI视频生成模型Seedance2.0怎么用?Seedance 2.0在哪?

    字节跳动旗下即梦平台近日正式上线新一代AI视频生成模型Seedance2.0,凭借多模态参考、高效创作与后期编辑融合等核心突破,成为影视、广告、短视频创作领域的焦点。该模型支持同时上传12个参考文件(图片、视频、音频),可精准复刻运镜逻辑、动作细节与音乐氛围,生成15秒视频仅需约30积分,较前代速度提升超10倍,显著降低废片率。

  • 百度发布文心大模型5.0正式版:2.4万亿参数 原生全模态建模

    今日,百度文心Moment”大会在上海召开。 大会现场,百度正式发布了文心大模型5.0正式版。 据介绍,该模型基于原生全模态建模,拥有2.4万亿参数,支持文本、图像、音频、视频等多种信息理解输出。 目前,文心5.0正式版可在百度千帆平台调用,文心一言官网、百度慧播星及文心助手等其他百度AI产品也已接入。 此前,文心5.0以1460分位列LMArena文本榜国内第一、全球第八�

  • 影视飓风Tim回应字节Seedance 2.0模型:能力太恐怖

    知名视频博主Tim深度评测字节跳动AI视频模型Seedance2.0,盛赞其视频生成精细度、运镜流畅性及音画匹配度,称其可能“改变视频行业”。但他在测试中发现“恐怖”细节:仅上传个人照片,系统便自动生成高度相似的声音并匹配语气;上传建筑正面照后,模型竟能生成建筑背面的运镜,仿佛“知道”背后景象。Seedance2.0采用双分支扩散变换器架构,能同时生成视频与音频,用户上传图片或提示即可在60秒内生成带原生音频的多镜头序列视频。

  • Seedance 2.0模型怎么用?字节跳动Seedance 2.0入口在哪?

    字节跳动旗下即梦平台近日推出的新一代AI视频生成模型Seedance2.0,凭借多模态参考、生成与编辑融合等技术创新,迅速成为影视、广告及短视频创作领域的“现象级”工具。该模型支持同时上传图片、视频、音频等12类参考文件,可精准复刻运镜轨迹、动作细节与音乐氛围,生成15秒视频仅需约30积分,速度较前代提升超10倍,废片率大幅降低,被业内称为“AI视频创作的效率革

今日大家都在搜的词: