首页 > 原创 > 关键词  > AI视频生成最新资讯  > 正文

AI日报:百度发布文心5.0;可灵2.5Turbo模型上线“首尾帧”功能;微博推出 VibeThinker-1.5B

2025-11-13 15:50 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://app.aibase.com/zh

1、视频生成可控性再升级!可灵2.5Turbo模型上线“首尾帧”功能

可灵2.5Turbo模型的推出,显著提升了AI视频生成的可控性、稳定性与一致性,为专业创意内容生产提供了更优质的解决方案。其在动态效果、文本响应精度、风格保持能力以及整体美学效果方面均有明显提升,并引入了全新的首尾帧功能,使创作者能够更精准地控制视频的起点和终点状态。

【AiBase提要:】

🚀 可灵2.5Turbo模型显著提升了AI视频生成的可控性和稳定性。

🎨 在动态效果、文本响应精度和风格保持能力上实现突破。

📽️ 新增首尾帧功能,帮助创作者精准控制视频的起点和终点状态。

2、百度发布全新原生全模态大模型文心5.0

百度在2025年11月13日的百度世界大会上正式推出了最新原生全模态大模型——文心5.0。该模型拥有2.4万亿参数量,并采用了原生全模态统一建模技术,能够同时理解和生成文本、图像、音频和视频等多种信息,展现出强大的多模态能力。文心5.0在多个领域表现出色,其语言与多模态理解能力与国际顶尖模型相当,而图像和视频生成能力在全球领先。用户可以通过文心App体验功能,开发者和企业用户也可以通过百度千帆平台调用API服务。

image.png

【AiBase提要:】

🚀 文心5.0采用原生全模态技术,支持文本、图像、音频和视频等多种信息的理解与生成。

📈 在权威基准测试中,文心5.0的多模态理解能力与全球顶尖模型相当,显示出其强大潜力。

🌐 用户可通过文心 App 体验新模型,开发者可调用 API 服务,推动智能应用的发展。

3、微博推出 VibeThinker-1.5B,低成本 AI 模型挑战大型语言模型

微博推出 VibeThinker-1.5B,这是一个拥有15亿参数的大型语言模型(LLM),基于阿里巴巴的 Qwen2.5-Math-1.5B 进行了精细调整,并在 Hugging Face、GitHub 和 ModelScope 上免费提供。尽管体积较小,但在数学和代码任务上表现出色,甚至超越了6710亿参数的 DeepSeek 的 R1 模型。其后期训练成本仅7800美元,远低于同类模型。VibeThinker-1.5B 采用了名为“谱 - 信号原则”的训练框架,使得小模型也能实现高效的推理能力。

image.png

【AiBase提要:】

🧠 VibeThinker-1.5B 是微博推出的15亿参数开源 AI 模型,表现出色,甚至超越大型模型。

💰 该模型后期训练成本仅为7800美元,远低于同类模型数十万的费用。

🔍 采用 “谱 - 信号原则” 训练框架,使小模型能够高效推理,提升了小型模型的竞争力。

详情链接:https://huggingface.co/WeiboAI/VibeThinker-1.5B

4、OpenAI重磅推出GPT-5.1:更快、更准、更具“人情味”的个性化AI助理

OpenAI推出了GPT-5.1,旨在提升ChatGPT的灵活性、响应速度和个性化体验。新模型在语言表达、对话风格适应性以及情绪感知方面有显著改进,同时引入了自适应推理功能,以满足不同任务的需求。

image.png

【AiBase提要:】

🚀 GPT-5.1提升了响应速度和语言清晰度,使对话更加自然。

🧠 新增自适应推理功能,能根据问题复杂度调整处理时间。

🎨 提供多种沟通风格选择,增强用户个性化体验。

5、李飞飞的 World Labs 发布首款商用 3D 世界模型 Marble,支持多种输入生成

李飞飞的World Labs发布了首款商用3D世界模型Marble,支持多种输入方式生成可编辑的3D环境,并具备AI编辑功能,兼容主流VR设备,适用于游戏开发、影视特效等多个领域。

image.png

【AiBase提要:】

🌟 Marble 是首款商用的3D世界模型,支持多种输入生成可编辑环境。

🎮 该产品内置AI编辑工具,让用户更便捷地设计和定制3D场景。

🕶️ Marble 兼容主流VR设备,用户可立即体验生成的3D世界。

详情链接:https://marble.worldlabs.ai/

6、东北大学开源多语言翻译“核弹”!NiuTrans.LMT支持60语种234方向,低资源语言翻译重大突破

东北大学开源的NiuTrans.LMT大模型在多语言翻译领域取得重大突破,支持60种语言、234个翻译方向,尤其在低资源语言上实现显著进展。其双中心架构避免了二次失真,提升了跨文化交互的效率和准确性。

【AiBase提要:】

🧠 双中心架构打破英语霸权,支持中英双核心翻译

🌐 三层语言覆盖兼顾效率与公平,提升低资源语言翻译能力

🚀 两阶段训练登顶FLORES-200,性能卓越

详情链接:https://github.com/NiuTrans/LMT

7、谷歌Gemini Live语音大升级!语速随心调、口音任你选,ChatGPT语音模式遭遇最强挑战

谷歌Gemini Live语音功能的升级,通过五大核心能力将AI对话推向新高度,为用户带来更自然、个性化的交互体验。

image.png

【AiBase提要:】

🗣️语速随口令实时变化,支持个性化语言训练。

😊情绪感知,语气自适应,提升对话体验。

🎭口音个性注入,让对话更有趣。

8、阿里“千问”项目秘密启动:基于Qwen模型,全面对标ChatGPT发起C端AI未来之战

阿里巴巴启动代号为“千问”的重大项目,旨在打造同名个人AI助手,全面对标ChatGPT。此举标志着阿里正式加入全球AI应用的顶级竞赛,并将C端AI应用推向战略核心。

【AiBase提要:】

🚀 阿里巴巴启动“千问”项目,打造个人AI助手,全面对标ChatGPT。

💡 基于Qwen模型的优秀性能和国际影响力,阿里希望赢得AI竞争。

📈 阿里将C端AI应用推向战略核心,布局面向消费者市场。

举报

  • 相关推荐
  • AI日报:Lovart AI上线“元素拆分”功能;Xcode 26.1.1发布;阿里云通义模型首次大规模赋能双11

    本期AI日报涵盖八大热点:Lovart AI推出"元素拆分"功能,实现海报智能分层编辑;苹果Xcode 26.1.1优化AI编码性能;阿里云通义模型双11单日翻译调用量突破14亿次;Gemini 3在历史手稿破译中展现专家级能力;德国法院裁定OpenAI使用歌词训练构成侵权;开源语音模型Maya1实现富有表现力的实时文本转语音;Meta首席AI科学家LeCun计划离职创办世界模型公司;AI专家罗福莉加入小米,将致力于构建物理世界智能。

  • AI日报:李飞飞Marble 3D世界模型公测;OpenAI首次推出ChatGPT群聊功能;百度发布多模态 AI助手超能小度

    本期AI日报聚焦多项技术突破:World Labs推出Marble 3D模型,实现多模态生成可交互虚拟世界;OpenAI在韩新试点ChatGPT群聊功能,支持多人协作互动;苹果更新隐私政策,要求第三方AI调用需明示授权;百度发布多模态助手“超能小度”,支持空间感知与设备免费升级;LinkedIn推出AI人脉搜索,通过自然语言精准匹配专业人士;Cursor完成23亿美元融资,估值达293亿;Character AI与耶鲁合作实现音画同步技术Ovi;Google NotebookLM上线深度研究工具,支持多格式文件分析与知识库构建。

  • REDMI Turbo 5 1月登场:首发天玑8500

    博主爆料称,天玑8500芯片预计1月亮相,Redmi Turbo 5将首发搭载。该芯片采用台积电4nm工艺,配备8核A725全大核设计,主频达3.4GHz,GPU为Mali-G720,性能超越骁龙8 Gen3与8s Gen4,安兔兔跑分达220万。新机还将配备1.5K直屏与大容量电池,成为Redmi Turbo系列最强机型,值得期待。

  • 冷美人退赛后冲上热搜第一:本人1分钟视频报价50元

    微博话题冷美人退赛”冲上热搜榜第一名,引发关注。 据媒体报道,湖南张家界七星山景区荒野求生挑战赛热门选手冷美人”因体检未通过遗憾退赛。 知情人士称,幸好当时旁边有人把她扶住了,然后送往医院,冷美人”醒过来第一句话就是这是哪?要去哪里”,她感到非常遗憾,说着不甘心”,还说给你们添麻烦了”。 据悉,冷美人”本名叫杨朝芹,来自云南,在这次�

  • 短视频加速跑入AI时代

    「现在是西天取经的第996天,刚把师父从妖怪嘴里救出来,师父身上都还是热乎的,我们就马不停蹄开始出发了。」在抖音,都能看到《西游记》里师徒四人的取经vlog了。 采访高考完刚出考场的爱因斯坦、孟德尔、门捷列夫;慈溪逛颐和园Vlog、大禹治水现场直播,各种AI生成的视频成为网友「玩梗搞抽象」的核心生产力。 尽管在专业影视

  • 长视频,要MCN化?

    过去十多年,长视频平台习惯用头部综艺与大剧撬动增长:内容够强,自然破圈,声量带动会员与广告。 这套“内容中心逻辑”曾行之有效。 但短视频重写了注意力分配。用户不再愿意投入整段时间追一个叙事,三十秒的情绪刺激就足以满足娱乐需求。内容生命周期被压缩,哪怕是重金制作,也可能上线当周见顶、难以延展。 在这种环境下,平台不得不寻找新的增长方式。�

  • 首发科天玑8500!REDMI Turbo 5获认证:支持100W闪充

    继工信部入网之后,REDMI Turbo 5近日又获得了国内的3C认证,距离上市不远了。 认证信息显示,REDMI Turbo 5支持100W有线闪充,这个规格目前已经成为小米旗下主流标配。

  • AI日报:HeyGen发布AI视频翻译引擎;科大讯飞推星火 X1.5;QQ浏览器推出AI+小窗

    本期AI日报聚焦多项技术突破:HeyGen推出精准唇形同步的视频翻译引擎;科大讯飞发布星火X1.5大模型,提升多语言处理能力;QQ浏览器新增AI助手浮窗;科大讯飞推出软硬一体方案,实现高噪声环境精准识别;谷歌Gemini 3 Pro预览版支持百万级上下文窗口;Comfy Cloud让Stable Diffusion实现零门槛创作;谷歌Gemini新增深度研究功能,可整合邮件生成智能报告;上海AgiBot机器人10分钟完成复杂制造任务,重塑生产效率。

  • BOE(京东方)亮相2025世界显示产业创新发展大会 AI赋能显示构建视界新生态

    2025年11月3日,世界显示产业创新发展大会在成都召开,京东方首席执行官方强发表主题演讲,强调显示产业正向“质量升级”转型。京东方展示了前沿显示技术与AI融合成果,包括ADS Pro高端液晶、f-OLED柔性显示及α-MLED技术,推出多款创新产品如110英寸4K UB Cell电视、自然光显示技术及AI应用方案。公司致力于通过AI赋能产业,推动可持续发展,并布局“屏之物联”生态,引领行业迈向高质量发展新阶段。

  • Sora App的AI视频社交,给了百度们新希望

    Sora2发布两周后,百度的蒸汽机AI视频模型,和谷歌Veo3.1撞了档期。 两家公司选择同期发布并非有多默契,而是Sora2带来的压迫感促使它们不得不加快脚步。 奥尔特曼将形容Sora2为“创意领域的ChatGPT3.5时刻”,不仅在物理逻辑、画面连贯性、真实感和音画同步等方面实现了质的飞跃,还把Sora从一个“文本到视频”的工具进化成一个“创意到生态”的平台。 这无疑是扔在AI视�

今日大家都在搜的词: