欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://app.aibase.com/zh
1、视频生成可控性再升级!可灵2.5Turbo模型上线“首尾帧”功能
可灵2.5Turbo模型的推出,显著提升了AI视频生成的可控性、稳定性与一致性,为专业创意内容生产提供了更优质的解决方案。其在动态效果、文本响应精度、风格保持能力以及整体美学效果方面均有明显提升,并引入了全新的首尾帧功能,使创作者能够更精准地控制视频的起点和终点状态。
【AiBase提要:】
🚀 可灵2.5Turbo模型显著提升了AI视频生成的可控性和稳定性。
🎨 在动态效果、文本响应精度和风格保持能力上实现突破。
📽️ 新增首尾帧功能,帮助创作者精准控制视频的起点和终点状态。
2、百度发布全新原生全模态大模型文心5.0
百度在2025年11月13日的百度世界大会上正式推出了最新原生全模态大模型——文心5.0。该模型拥有2.4万亿参数量,并采用了原生全模态统一建模技术,能够同时理解和生成文本、图像、音频和视频等多种信息,展现出强大的多模态能力。文心5.0在多个领域表现出色,其语言与多模态理解能力与国际顶尖模型相当,而图像和视频生成能力在全球领先。用户可以通过文心App体验功能,开发者和企业用户也可以通过百度千帆平台调用API服务。

【AiBase提要:】
🚀 文心5.0采用原生全模态技术,支持文本、图像、音频和视频等多种信息的理解与生成。
📈 在权威基准测试中,文心5.0的多模态理解能力与全球顶尖模型相当,显示出其强大潜力。
🌐 用户可通过文心 App 体验新模型,开发者可调用 API 服务,推动智能应用的发展。
3、微博推出 VibeThinker-1.5B,低成本 AI 模型挑战大型语言模型
微博推出 VibeThinker-1.5B,这是一个拥有15亿参数的大型语言模型(LLM),基于阿里巴巴的 Qwen2.5-Math-1.5B 进行了精细调整,并在 Hugging Face、GitHub 和 ModelScope 上免费提供。尽管体积较小,但在数学和代码任务上表现出色,甚至超越了6710亿参数的 DeepSeek 的 R1 模型。其后期训练成本仅7800美元,远低于同类模型。VibeThinker-1.5B 采用了名为“谱 - 信号原则”的训练框架,使得小模型也能实现高效的推理能力。

【AiBase提要:】
🧠 VibeThinker-1.5B 是微博推出的15亿参数开源 AI 模型,表现出色,甚至超越大型模型。
💰 该模型后期训练成本仅为7800美元,远低于同类模型数十万的费用。
🔍 采用 “谱 - 信号原则” 训练框架,使小模型能够高效推理,提升了小型模型的竞争力。
详情链接:https://huggingface.co/WeiboAI/VibeThinker-1.5B
4、OpenAI重磅推出GPT-5.1:更快、更准、更具“人情味”的个性化AI助理
OpenAI推出了GPT-5.1,旨在提升ChatGPT的灵活性、响应速度和个性化体验。新模型在语言表达、对话风格适应性以及情绪感知方面有显著改进,同时引入了自适应推理功能,以满足不同任务的需求。

【AiBase提要:】
🚀 GPT-5.1提升了响应速度和语言清晰度,使对话更加自然。
🧠 新增自适应推理功能,能根据问题复杂度调整处理时间。
🎨 提供多种沟通风格选择,增强用户个性化体验。
5、李飞飞的 World Labs 发布首款商用 3D 世界模型 Marble,支持多种输入生成
李飞飞的World Labs发布了首款商用3D世界模型Marble,支持多种输入方式生成可编辑的3D环境,并具备AI编辑功能,兼容主流VR设备,适用于游戏开发、影视特效等多个领域。

【AiBase提要:】
🌟 Marble 是首款商用的3D世界模型,支持多种输入生成可编辑环境。
🎮 该产品内置AI编辑工具,让用户更便捷地设计和定制3D场景。
🕶️ Marble 兼容主流VR设备,用户可立即体验生成的3D世界。
详情链接:https://marble.worldlabs.ai/
6、东北大学开源多语言翻译“核弹”!NiuTrans.LMT支持60语种234方向,低资源语言翻译重大突破
东北大学开源的NiuTrans.LMT大模型在多语言翻译领域取得重大突破,支持60种语言、234个翻译方向,尤其在低资源语言上实现显著进展。其双中心架构避免了二次失真,提升了跨文化交互的效率和准确性。
【AiBase提要:】
🧠 双中心架构打破英语霸权,支持中英双核心翻译
🌐 三层语言覆盖兼顾效率与公平,提升低资源语言翻译能力
🚀 两阶段训练登顶FLORES-200,性能卓越
详情链接:https://github.com/NiuTrans/LMT
7、谷歌Gemini Live语音大升级!语速随心调、口音任你选,ChatGPT语音模式遭遇最强挑战
谷歌Gemini Live语音功能的升级,通过五大核心能力将AI对话推向新高度,为用户带来更自然、个性化的交互体验。

【AiBase提要:】
🗣️语速随口令实时变化,支持个性化语言训练。
😊情绪感知,语气自适应,提升对话体验。
🎭口音个性注入,让对话更有趣。
8、阿里“千问”项目秘密启动:基于Qwen模型,全面对标ChatGPT发起C端AI未来之战
阿里巴巴启动代号为“千问”的重大项目,旨在打造同名个人AI助手,全面对标ChatGPT。此举标志着阿里正式加入全球AI应用的顶级竞赛,并将C端AI应用推向战略核心。
【AiBase提要:】
🚀 阿里巴巴启动“千问”项目,打造个人AI助手,全面对标ChatGPT。
💡 基于Qwen模型的优秀性能和国际影响力,阿里希望赢得AI竞争。
📈 阿里将C端AI应用推向战略核心,布局面向消费者市场。
(举报)
