首页 > 原创 > 关键词  > AI视频创作最新资讯  > 正文

AI日报:可灵3.0发布;阿里大模型品牌正式更名为千问;Mistral AI 发布 Voxtral Transcribe 2 语音模型

2026-02-05 16:46 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://app.aibase.com/zh

1、全球首创“主体参考”:可灵AI3.0正式发布,15秒长视频开启AI导演时代

可灵AI 3.0的发布标志着AI视频创作进入了一个全新的时代,通过多模态输入输出的一体化,重新定义了AI视频的创作工作流,让每个人都能成为导演。

image.png

【AiBase提要:】

🎥 全球首创主体参考功能,精准锁定主角、道具或场景特征。

🎬 智能分镜与超长生成,实现电影感叙事。

🖼️ 支持多语言及方言,实现口型、神态与音色完美同步。

2、阿里AI战略再升级:大模型品牌正式更名为“千问”

阿里巴巴集团宣布将旗下AI技术总称及核心品牌统一为“千问”,以消除多品牌并存带来的市场认知混乱,标志着阿里在AI领域的品牌传播进入高度聚焦的新阶段。同时,SpaceX提交了部署百万卫星系统的申请,引发行业关注。

【AiBase提要:】

🧠 千问大模型品牌统一为“千问”,提升市场认知一致性。

🌐 全球范围内统一使用英文名称 Qwen,强化国际品牌形象。

🛰️ SpaceX提交部署百万卫星系统申请,引发广泛关注。

3、延迟低于 0.2 秒!Mistral AI 发布 Voxtral Transcribe 2 语音模型,支持中文实时转录

Mistral AI 推出的 Voxtral Transcribe 2 语音转文字模型系列,针对不同应用场景优化,解决了语音交互中的高延迟和成本痛点。Voxtral Realtime 实现了极低延迟,而 Voxtral Mini 则以高性价比和长音频处理能力著称。两款模型均支持包括中文在内的13种语言,定价策略具有竞争力,适合多种语音交互场景。

image.png

【AiBase提要:】

⚡ 极低延迟: Voxtral Realtime 模型将转录延迟降至200ms 以内,支持音频即时转录,且已开源模型权重。

🏆 高性价比: Voxtral Mini 版在准确率上优于 GPT-4o mini 等同类产品,支持3小时超长录音,价格极具优势。

🌐 多语支持: 全系列模型原生支持中文等13种语言,广泛适配全球化的语音办公与实时交互场景。

4、上海 AI 实验室发布科学多模态模型书生Intern-S1-Pro

上海 AI 实验室发布了全球开源参数规模最大的科学多模态模型“书生 Intern-S1-Pro”,该模型基于 SAGE 技术架构,拥有 1 万亿参数,具备国际领先的科学能力,特别是在逻辑推理和科研智能体方面表现突出。

【AiBase提要:】

✨ 书生 Intern-S1-Pro 是全球开源参数规模最大的科学多模态模型,拥有 1 万亿参数。

🧠 模型在高难度综合学科评测中表现出色,逻辑推理能力达到奥林匹克竞赛金牌选手水平。

🚀 采用混合专家架构(MoE),优化计算效率并降低资源消耗,为超大规模模型训练奠定基础。

5、Gemini 用户量突破 7.5 亿:谷歌财报亮眼,紧咬 ChatGPT 不放

谷歌母公司 Alphabet 发布了 2025 年第四季度财报,其中 AI 业务表现亮眼。Gemini 的月活跃用户数已突破 7.5 亿,展现出惊人的增长势头。同时,谷歌推出了低价订阅方案 Google AI Plus,并推出了自研芯片 Ironwood,推动全年营收首次突破 4000 亿美元大关,标志着公司全面转型为“AI 优先”的企业实体。

【AiBase提要:】

📈 Gemini 用户量飙升至 7.5 亿,展现强劲增长势头。

💰 谷歌推出低价订阅方案 Google AI Plus,吸引价格敏感用户。

🚀 自研芯片 Ironwood 和 Gemini 3 推动 Alphabet 年营收突破 4000 亿美元。

6、支持AI消除屏幕摩尔纹!华为 Mate 80 系列正式推送 HarmonyOS 新版固件

华为Mate 80系列手机推送了HarmonyOS 6.0.0.130SP17系统更新,引入了AI消除屏幕摩尔纹功能,提升了影像处理能力,并优化了星闪和定位性能。

【AiBase提要:】

✨ 引入AI修图-消除屏纹功能,精准去除摩尔纹,提升成片清晰度。

📶 优化星闪音频连接稳定性,增强蓝牙使用体验。

🧭 提升导航定位精准度,优化移动网络连接性能。

7、奥运史首创!米兰冬奥宣布启用阿里“千问”官方大模型

文章介绍了2026年米兰冬奥会将启用阿里千问官方大模型,推动奥运科技迈向智能时代,并提到B站与春晚的合作,展示了AI在顶级IP中的广泛应用。

image.png

【AiBase提要:】

🧠 奥运史上首个官方大模型问世,标志着智能奥运的开启。

📺 B站与春晚合作,提升弹幕互动体验。

🚀 AI正在深度重塑全球顶级IP的商业逻辑与用户体验。

8、我国生成式 AI 用户规模破 6 亿:普及率超四成,算力水平跃居全球前列

我国生成式人工智能用户规模迅速增长,普及率显著提升,同时算力基础设施也取得突破性进展,为AI技术的广泛应用提供了坚实支撑。

【AiBase提要:】

📈 我国生成式人工智能用户规模已达 6.02 亿,较 2024 年底增长 141.7%,普及率达到 42.8%。

💻 全国已建成 42 个万卡智算集群,智能算力总规模超过 1590 EFLOPS,位居全球前列。

🚀 生成式 AI 正加速融入日常生活与生产,成为数字化转型及经济高质量发展的重要引擎。

举报

  • 相关推荐
  • 全面AI化的搜狗输入法,又来突破输入天花板了?

    在办公室午休时间,凑近手机轻声说出项目总结要点,语音输入的准确率可高达98%;在国外游玩想要和民宿房东无障碍沟通,不再需要切换翻译APP,而是直接用输入法快捷翻译;从缩写到口语化词语,再到在线追梗,输入法都能抢先一步智能联想到最佳关键词…… 在移动互联网的生态版图中,输入法作为连接用户与数字世界的基础入口,早已超越了单纯“文字转换”的工具属性

  • AI日报:Seedance2.0紧急暂停真人参考功能;Qwen-Image-2.0发布;混元推首个产业级2Bit端侧模型

    本期AI日报聚焦行业动态:腾讯推出首个产业级2Bit端侧模型,实现小体积高性能,适用于手机等隐私敏感场景;蚂蚁阿福成为央视健康生活合作伙伴,单日健康咨询达千万次;ChatGPT免费版将引入广告,OpenAI明确隐私保护规则;字节Seedance2.0因肖像争议暂停真人参考功能;华为发布全球首个虚实融合视频模型,实现毫秒级实时交互;Cursor发布Composer1.5,性能提升显著;阿里云推出Qwen-Image-2.0,图像生成与编辑能力合一;亚马逊入局内容授权市场,微软争夺高质量数据资源。

  • 京东影像大赛征稿进行中 采销邀请影视飓风Tim寄语视频创作者

    猛玛近日举办品牌战略暨新品发布会,展示其在无线音视频领域的技术布局与全球化成果。作为第八届京东影像大赛官方合作伙伴,猛玛为参赛者提供全方位创作支持。会上,品牌全球代言人Tim分享创作经验,针对初学者困惑给出实用建议:严肃创作应注重文稿构思,可借助思维导图整合观点;现场创作则需保持观察与记录习惯,积累素材。Tim鼓励年轻创作者勇于尝试,避免盲目比较,注重原创发挥个人创造力。京东影像大赛作品征集火热进行中,参赛者可通过京东APP搜索“影像大赛”了解详情并上传作品,有机会赢取丰厚奖金及专业设备。

  • 腾讯张军回应AI 50米洗车题翻车:或是人机时代新的互相驯化

    一道看似简单的“50米洗车选择题”意外成为测试AI逻辑能力的试金石,国内外多款主流AI大模型因给出矛盾答案引发网友热议。腾讯公关总监张军发文提及此事,直言“大部分AI都翻车了”,并分享了人机交互中的趣味发现。他透露,最初向腾讯元宝模型提问时也得到“不合理答案”,但通过优化提示词调整问题表述后,模型给出了更符合逻辑的回复。张军感慨:“这或许是AI时代一种新的互相驯化——人类需要更精准地表达需求,AI则通过迭代理解更复杂的语境。”此次事件不仅为AI训练提供了生动案例,也引发对人机交互边界的思考。专家表示,随着AI应用场景拓展,用户需掌握“提问技巧”,而开发者则需优化模型对模糊语境的理解能力。

  • 豆包输入法iOS版发布1.1.0版春节更新 上线手写键盘功能

    豆包输入法iOS版1.1.0版本更新,新增手写键盘功能,方便用户手写输入生僻字进行查询,尤其适合中老年群体。同时优化了“按住空格说话”功能,新增关闭选项,满足不同操作习惯。新增公式换算联想功能,提升查询效率。此外,新增更多语音修改推荐,优化双拼输入准确率。针对春节,加入马年祝福相关词条,优化键盘输入准确率与打字速度。联想模型新春版上线,输入祝福语时自动提供丰富内容。支持定制专属藏头诗,输入“祝姓名+新年快乐”即可一键生成,且每句话支持自由选择,方便个性化调整。用户还可输入上联,让AI智能接下联,增添节日乐趣。

  • 千匠网络新“一星三云”产品体系,开启AI驱动产业智能新篇章

    千匠网络确立全新战略定位,成为“AI驱动的产业电商与供应链解决方案服务商”。公司以“双轮驱动”为核心推进产业数字化从“连接”迈向“赋能”:AI驱动将人工智能升级为贯穿产业全价值链的核心引擎,实现全链路智能化;业务融合则打破产业电商与供应链协同间的壁垒,构建“智能感知、智能决策、智能执行”的产业数字化新范式。全新“一星三云”产品体系系统化承载智能化落地方案,助力企业在AI时代构建可持续的竞争优势。

  • 闪极Loomos L1 AI拍摄眼镜:架构革新+全链路AI,助力智能穿戴升级

    闪极科技推出旗舰级Loomos L1 AI拍摄眼镜,以创新架构和前沿功能重新定义智能眼镜标准。其搭载全新凤凰架构,采用4纳米四核ARM主处理器与专业蓝牙Soc的双芯组合,解决了初代产品通话卡顿、画质不佳等问题。首创摄像头与前框解耦设计,将索尼1200万像素CMOS融入镜腿,兼顾卓越拍摄效果与美观。产品采用钛合金复合板材框架,鼻梁体感重量控制在20克以内,并提供多种时尚框型与配色。核心AI功能革新包括独家VAD主动人声识别算法,可实现全天候自动录音、拍照、录像,并实时上传云端分析,形成个人记忆库。此外,隐形镜头盖设计可一秒遮蔽摄像头,平衡拍摄便捷与隐私安全。配合多功能换电仓与降噪聚音旗等配件,满足不同场景需求。闪极L1以其极致佩戴体验和全链路AI赋能,成为内容创作者、生活记录者及办公协同者的智能伴侣。

  • AI这把火,也该烧到网易了

    网易2025年财报显示,全年总营收首次突破千亿,净利润达373亿元,现金储备增至1635亿元,业绩亮眼。但第四季度营收增长乏力,游戏收入增速放缓至3.4%,主要由于手游新品断档、依赖老游戏。市场担忧其缺乏新爆款、利润增长靠“省钱”及AI策略相对保守。尽管网易强调以AI提升研发与运营效率,但股价在财报后下跌,反映投资者对其长期增长动力及AI浪潮下竞争力的疑虑。

  • AI日报:字节发布超强视频模型Seedance2.0;小红书秘密研发AI剪辑器OpenStoryline;神秘AI模型“Pony Alpha”曝光

    本期AI日报聚焦多领域进展:字节跳动发布视频生成模型Seedance2.0,显著降低视频制作门槛;小红书研发AI视频剪辑工具OpenStoryline,支持对话式编辑;千问APP推出免单卡功能,便利年货采购;顶级域名AI.com以7000万美元成交,刷新历史纪录;神秘模型Pony Alpha因高性能免费引发关注,身份存疑;OpenAI首款AI硬件“Dime”智能耳机曝光,预计2026年发布;苹果CarPlay将支持第三方语音助手,提升交互体验;阿里新一代开源模型Qwen3.5代码现身,或为原生视觉语言模型,即将发布。

  • 声网联合美团、xbench 发布 AI 外呼智能体评测基准:VoiceAgentEval

    随着生成式AI在客服领域的快速渗透,AI外呼已从最初的辅助沟通工具进化为企业优化客户沟通、提升运营效率的关键环节,应用场景覆盖招聘、销售、客服等,并成为生成式AI最广泛应用场景之一。同时,随着对话式AI技术的不断成熟,AI外呼正从“能通话”向“会沟通、懂需求”的专家级交互升级。为全面客观评估模型在AI外呼中的综合性能,声网联合美团、xBench共同推出用于评估大模型在AI外呼场景性能表现的综合评测标准VoiceAgentEval,旨在填补行业空白,让从业者更清晰地了解在真实AI外呼业务场景中各个大模型的综合性能表现,并为AI外呼场景的落地与技术体验的优化提供核心参考依据。

今日大家都在搜的词: