首页 > 原创 > 关键词  > AI视频生成最新资讯  > 正文

AI日报：百度发布文心5.0；可灵2.5Turbo模型上线“首尾帧”功能；微博推出 VibeThinker-1.5B

2025-11-13 15:50 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://app.aibase.com/zh

1、视频生成可控性再升级!可灵2.5Turbo模型上线“首尾帧”功能

可灵2.5Turbo模型的推出，显著提升了AI视频生成的可控性、稳定性与一致性，为专业创意内容生产提供了更优质的解决方案。其在动态效果、文本响应精度、风格保持能力以及整体美学效果方面均有明显提升，并引入了全新的首尾帧功能，使创作者能够更精准地控制视频的起点和终点状态。

【AiBase提要:】

🚀 可灵2.5Turbo模型显著提升了AI视频生成的可控性和稳定性。

🎨 在动态效果、文本响应精度和风格保持能力上实现突破。

📽️ 新增首尾帧功能，帮助创作者精准控制视频的起点和终点状态。

2、百度发布全新原生全模态大模型文心5.0

百度在2025年11月13日的百度世界大会上正式推出了最新原生全模态大模型——文心5.0。该模型拥有2.4万亿参数量，并采用了原生全模态统一建模技术，能够同时理解和生成文本、图像、音频和视频等多种信息，展现出强大的多模态能力。文心5.0在多个领域表现出色，其语言与多模态理解能力与国际顶尖模型相当，而图像和视频生成能力在全球领先。用户可以通过文心App体验功能，开发者和企业用户也可以通过百度千帆平台调用API服务。

image.png

【AiBase提要:】

🚀 文心5.0采用原生全模态技术，支持文本、图像、音频和视频等多种信息的理解与生成。

📈 在权威基准测试中，文心5.0的多模态理解能力与全球顶尖模型相当，显示出其强大潜力。

🌐 用户可通过文心 App 体验新模型，开发者可调用 API 服务，推动智能应用的发展。

3、微博推出 VibeThinker-1.5B，低成本 AI 模型挑战大型语言模型

微博推出 VibeThinker-1.5B，这是一个拥有15亿参数的大型语言模型（LLM），基于阿里巴巴的 Qwen2.5-Math-1.5B 进行了精细调整，并在 Hugging Face、GitHub 和 ModelScope 上免费提供。尽管体积较小，但在数学和代码任务上表现出色，甚至超越了6710亿参数的 DeepSeek 的 R1 模型。其后期训练成本仅7800美元，远低于同类模型。VibeThinker-1.5B 采用了名为“谱 - 信号原则”的训练框架，使得小模型也能实现高效的推理能力。

image.png

【AiBase提要:】

🧠 VibeThinker-1.5B 是微博推出的15亿参数开源 AI 模型，表现出色，甚至超越大型模型。

💰 该模型后期训练成本仅为7800美元，远低于同类模型数十万的费用。

🔍 采用 “谱 - 信号原则” 训练框架，使小模型能够高效推理，提升了小型模型的竞争力。

详情链接:https://huggingface.co/WeiboAI/VibeThinker-1.5B

4、OpenAI重磅推出GPT-5.1:更快、更准、更具“人情味”的个性化AI助理

OpenAI推出了GPT-5.1，旨在提升ChatGPT的灵活性、响应速度和个性化体验。新模型在语言表达、对话风格适应性以及情绪感知方面有显著改进，同时引入了自适应推理功能，以满足不同任务的需求。

image.png

【AiBase提要:】

🚀 GPT-5.1提升了响应速度和语言清晰度，使对话更加自然。

🧠 新增自适应推理功能，能根据问题复杂度调整处理时间。

🎨 提供多种沟通风格选择，增强用户个性化体验。

5、李飞飞的 World Labs 发布首款商用 3D 世界模型 Marble，支持多种输入生成

李飞飞的World Labs发布了首款商用3D世界模型Marble，支持多种输入方式生成可编辑的3D环境，并具备AI编辑功能，兼容主流VR设备，适用于游戏开发、影视特效等多个领域。

image.png

【AiBase提要:】

🌟 Marble 是首款商用的3D世界模型，支持多种输入生成可编辑环境。

🎮 该产品内置AI编辑工具，让用户更便捷地设计和定制3D场景。

🕶️ Marble 兼容主流VR设备，用户可立即体验生成的3D世界。

详情链接:https://marble.worldlabs.ai/

6、东北大学开源多语言翻译“核弹”！NiuTrans.LMT支持60语种234方向，低资源语言翻译重大突破

东北大学开源的NiuTrans.LMT大模型在多语言翻译领域取得重大突破，支持60种语言、234个翻译方向，尤其在低资源语言上实现显著进展。其双中心架构避免了二次失真，提升了跨文化交互的效率和准确性。

【AiBase提要:】

🧠 双中心架构打破英语霸权，支持中英双核心翻译

🌐 三层语言覆盖兼顾效率与公平，提升低资源语言翻译能力

🚀 两阶段训练登顶FLORES-200，性能卓越

详情链接:https://github.com/NiuTrans/LMT

7、谷歌Gemini Live语音大升级！语速随心调、口音任你选，ChatGPT语音模式遭遇最强挑战

谷歌Gemini Live语音功能的升级，通过五大核心能力将AI对话推向新高度，为用户带来更自然、个性化的交互体验。

image.png

【AiBase提要:】

🗣️语速随口令实时变化，支持个性化语言训练。

😊情绪感知，语气自适应，提升对话体验。

🎭口音个性注入，让对话更有趣。

8、阿里“千问”项目秘密启动:基于Qwen模型，全面对标ChatGPT发起C端AI未来之战

阿里巴巴启动代号为“千问”的重大项目，旨在打造同名个人AI助手，全面对标ChatGPT。此举标志着阿里正式加入全球AI应用的顶级竞赛，并将C端AI应用推向战略核心。

【AiBase提要:】

🚀 阿里巴巴启动“千问”项目，打造个人AI助手，全面对标ChatGPT。

💡 基于Qwen模型的优秀性能和国际影响力，阿里希望赢得AI竞争。

📈 阿里将C端AI应用推向战略核心，布局面向消费者市场。

举报

  • 相关推荐
关键词：

  • AI日报：李飞飞Marble 3D世界模型公测；OpenAI首次推出ChatGPT群聊功能；百度发布多模态 AI助手超能小度

    本期AI日报聚焦多项技术突破：World Labs推出Marble 3D模型，实现多模态生成可交互虚拟世界；OpenAI在韩新试点ChatGPT群聊功能，支持多人协作互动；苹果更新隐私政策，要求第三方AI调用需明示授权；百度发布多模态助手“超能小度”，支持空间感知与设备免费升级；LinkedIn推出AI人脉搜索，通过自然语言精准匹配专业人士；Cursor完成23亿美元融资，估值达293亿；Character AI与耶鲁合作实现音画同步技术Ovi；Google NotebookLM上线深度研究工具，支持多格式文件分析与知识库构建。

    ​AI ​3D虚拟世界 ​多模态输入

  • REDMI Turbo 5 1月登场：首发天玑8500

    博主爆料称，天玑8500芯片预计1月亮相，Redmi Turbo 5将首发搭载。该芯片采用台积电4nm工艺，配备8核A725全大核设计，主频达3.4GHz，GPU为Mali-G720，性能超越骁龙8 Gen3与8s Gen4，安兔兔跑分达220万。新机还将配备1.5K直屏与大容量电池，成为Redmi Turbo系列最强机型，值得期待。

    ​天玑8500 ​REDMI ​Turbo

  • AI日报：Lovart AI上线“元素拆分”功能；Xcode 26.1.1发布；阿里云通义模型首次大规模赋能双11

    本期AI日报涵盖八大热点：Lovart AI推出"元素拆分"功能，实现海报智能分层编辑；苹果Xcode 26.1.1优化AI编码性能；阿里云通义模型双11单日翻译调用量突破14亿次；Gemini 3在历史手稿破译中展现专家级能力；德国法院裁定OpenAI使用歌词训练构成侵权；开源语音模型Maya1实现富有表现力的实时文本转语音；Meta首席AI科学家LeCun计划离职创办世界模型公司；AI专家罗福莉加入小米，将致力于构建物理世界智能。

    ​AI设计 ​元素拆分 ​海报编辑

  • 冷美人退赛后冲上热搜第一：本人1分钟视频报价50元

    微博话题冷美人退赛”冲上热搜榜第一名，引发关注。 据媒体报道，湖南张家界七星山景区荒野求生挑战赛热门选手冷美人”因体检未通过遗憾退赛。 知情人士称，幸好当时旁边有人把她扶住了，然后送往医院，冷美人”醒过来第一句话就是这是哪？要去哪里”，她感到非常遗憾，说着不甘心”，还说给你们添麻烦了”。 据悉，冷美人”本名叫杨朝芹，来自云南，在这次�

    ​冷美人退赛 ​荒野求生挑战赛 ​张家界七星山

  • 短视频加速跑入AI时代

    「现在是西天取经的第996天，刚把师父从妖怪嘴里救出来，师父身上都还是热乎的，我们就马不停蹄开始出发了。」在抖音，都能看到《西游记》里师徒四人的取经vlog了。 采访高考完刚出考场的爱因斯坦、孟德尔、门捷列夫;慈溪逛颐和园Vlog、大禹治水现场直播，各种AI生成的视频成为网友「玩梗搞抽象」的核心生产力。 尽管在专业影视

    ​文章搜索 ​核心标签 ​AI生成

  • 长视频，要MCN化？

    过去十多年，长视频平台习惯用头部综艺与大剧撬动增长:内容够强，自然破圈，声量带动会员与广告。 这套“内容中心逻辑”曾行之有效。 但短视频重写了注意力分配。用户不再愿意投入整段时间追一个叙事，三十秒的情绪刺激就足以满足娱乐需求。内容生命周期被压缩，哪怕是重金制作，也可能上线当周见顶、难以延展。 在这种环境下，平台不得不寻找新的增长方式。�

    ​文章搜索 ​核心标签 ​长视频平台

  • 首发科天玑8500！REDMI Turbo 5获认证：支持100W闪充

    继工信部入网之后，REDMI Turbo 5近日又获得了国内的3C认证，距离上市不远了。 认证信息显示，REDMI Turbo 5支持100W有线闪充，这个规格目前已经成为小米旗下主流标配。

    ​REDMI ​Turbo ​5

  • AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏览器推出AI+小窗

    本期AI日报聚焦多项技术突破：HeyGen推出精准唇形同步的视频翻译引擎；科大讯飞发布星火X1.5大模型，提升多语言处理能力；QQ浏览器新增AI助手浮窗；科大讯飞推出软硬一体方案，实现高噪声环境精准识别；谷歌Gemini 3 Pro预览版支持百万级上下文窗口；Comfy Cloud让Stable Diffusion实现零门槛创作；谷歌Gemini新增深度研究功能，可整合邮件生成智能报告；上海AgiBot机器人10分钟完成复杂制造任务，重塑生产效率。

    ​AI视频翻译 ​唇形同步 ​跨语言本地化

  • BOE（京东方）亮相2025世界显示产业创新发展大会 AI赋能显示构建视界新生态

    2025年11月3日，世界显示产业创新发展大会在成都召开，京东方首席执行官方强发表主题演讲，强调显示产业正向“质量升级”转型。京东方展示了前沿显示技术与AI融合成果，包括ADS Pro高端液晶、f-OLED柔性显示及α-MLED技术，推出多款创新产品如110英寸4K UB Cell电视、自然光显示技术及AI应用方案。公司致力于通过AI赋能产业，推动可持续发展，并布局“屏之物联”生态，引领行业迈向高质量发展新阶段。

    ​显示产业 ​AI技术 ​京东方

  • Sora App的AI视频社交，给了百度们新希望

    Sora2发布两周后，百度的蒸汽机AI视频模型，和谷歌Veo3.1撞了档期。 两家公司选择同期发布并非有多默契，而是Sora2带来的压迫感促使它们不得不加快脚步。 奥尔特曼将形容Sora2为“创意领域的ChatGPT3.5时刻”，不仅在物理逻辑、画面连贯性、真实感和音画同步等方面实现了质的飞跃，还把Sora从一个“文本到视频”的工具进化成一个“创意到生态”的平台。 这无疑是扔在AI视�

    ​文章搜索 ​核心标签 ​AI视频模型

今日大家都在搜的词：

热文

  • 3 天
  • 7天

站长商机

广告

商务合作 侵权投诉 广告服务 版权声明 招聘

©CopyRight 2002-2020 CHINAZ.COM