「6月30日AI日报」百度开源文心大模型4.5系列；通义千问发布多模态生成模型Qwen VLo

2025-06-30 16:34 · 稿源：站长之家

欢迎来到AIbase【AI日报】栏目!

每天三分钟了解当日AI大事件，助你洞悉AI行业趋势、创新AI产品应用。

更多AI资讯访问:https://www.aibase.com/zh

1.百度重磅开源文心大模型4.5系列，十款新模型亮相!

百度正式发布文心大模型4.5系列并完全开源，包含多种参数配置的十款新模型，使用飞桨框架训练推理，FLOPs利用率47%，在文本多模态基准测试中表现优异，提供一站式使用指南和工具，方便开发者精调部署，已上传至Hugging Face、GitHub等平台。

体验地址:https://yiyan.baidu.com

Hugging Face:https://huggingface.co/baidu）

GitHub:https://github.com/PaddlePaddle/ERNIE

2.通义千问发布多模态统一理解与生成模型Qwen VLo

微信截图_20250628093705.png

Qwen VLo多模态大模型发布，基于Qwen-VL系列升级，采用渐进式生成方式，精准看懂世界并高质量再创造，支持开放指令编辑修改生成，具备多语言指令能力，可进行图文输入输出，目前处于预览阶段，体验地址为Qwen Chat平台。

体验地址:chat.qwen.ai

3.阿里Ovis-U1震撼发布:多模态AI三合一，开源赋能全球开发者

阿里巴巴国际AI团队发布Ovis-U1多模态大模型，3亿参数，集成多模态理解、文生图像和图像编辑功能，采用创新架构设计，基于Python3.10等技术栈构建，训练中引入合规性检查算法，代码模型权重等已公开，助力多领域应用。

项目:（https://huggingface.co/AIDC-AI/Ovis-U1-3B）

4.华为开源盘古7B稠密和72B混合专家模型

华为开源盘古7B稠密模型、72B混合专家模型及升腾推理技术，践行升腾生态战略，推动大模型技术研究与行业应用，相关模型权重代码已上线开源平台，邀请开发者等下载使用反馈。

5.一张图即可生成爆款视频!美图MOKI「AI创意广告」限时免费

微信截图_20250630083834.png

美图MOKI推出“AI创意广告”功能，用户上传图片选择模板即可生成专业级视频，集成七大主流视频生成模型，体验地址为www.moki.cn，可完成从创意到成片的完整流程。

体验地址:www.moki.cn

6.Gemini2.5Pro API 免费回归，开发者社区热烈响应

谷歌Gemini2.5Pro API重新纳入Google AI Studio免费层级，该模型多模态和推理能力强，支持多种输入类型，此次免费回归为开发者提供创新机会，免费计算资源翻倍，社区反应积极。

7.豆包「深入研究」功能在豆包APP、网页版及电脑版开启测试

微信截图_20250630140622.png

豆包APP等平台开启「深入研究」功能测试，可整合海量深度信息生成研究报告或可视化网页结果，用户输入指令几分钟获定制化报告，还支持一键转播客形式。

8.小米“AI百宝箱”内测期结束，7月5日起停止服务

小米“AI百宝箱”内测结束，计划7月5日暂停服务，内测收集了数据反馈，非放弃项目而是进行数据整理等战略规划，小米在AI领域持续投入探索构建多层次全场景AI生态。

9.新开源 AI 系统 OmniGen2:像GPT-4o 一样融合了图像和文本生成

北京人工智能研究院推出OmniGen2开源系统，专注文本图像生成编辑等，采用独立解码路径，基于Qwen2.5-VL-3B变换器，使用自定义扩散变换器，有反思机制，性能在多个基准测试中出色，将发布到Hugging Face平台。

项目:https://huggingface.co/OmniGen2/OmniGen2

10.知乎“直答”升级知识库功能，深度融合社区内容打造沉浸式AI问答体验

知乎“直答”升级知识库功能，深度融合社区内容，带来沉浸式阅读等创新功能，旨在提供沉浸式多场景AI问答体验，扩大答主内容影响力，降低用户查询成本。

（举报）

相关推荐

关键词：

荐AI日报：阿里推多模态模型Qwen3-Omni；谷歌推出AP2协议；百度推出Qianfan-VL 模型

本期AI日报聚焦多领域技术突破：阿里云推出全球首个全模态AI模型Qwen3-Omni，支持文本、图像、音频和视频统一处理；百度发布多尺寸视觉理解模型Qianfan-VL，优化企业级应用。苹果扩展Image Playground平台，引入ChatGPT等第三方模型。谷歌与PayPal合作推出AP2协议，推动AI支付安全创新。钉钉上线AI表格助手，支持自然语言生成表格。DeepSeek开源V3.1-Terminus模型，性能显著提升。Kimi推出Agent会员服务，智元机器人开源全球首个通用具身智能模型GO-1，降低技术门槛促进行业创新。

AI模型全模态阿里云
荐AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型；Claude Sonnet4.5发布

本期AI日报聚焦多项技术突破：DeepSeek发布V3.2-exp模型，通过稀疏注意力机制降低API成本50%；Anthropic推出Claude Sonnet 4.5，在编码任务表现卓越；ChatGPT新增即时结账功能，实现对话界面直接购物；OpenAI将推出AI版TikTok，所有内容由Sora2模型生成；百度地图升级小度想想2.0，提供智能出行服务；蚂蚁集团开源万亿参数模型Ring-1T-preview；DeepMind提出“帧链”概念，推动视频模型实现全面�

AI DeepSeek 稀疏注意力
荐AI日报：小红书发布对话合成模型 FireRedTTS-2；百度文心新模型登顶Hugging Face榜首；xAI将裁员500人

AI日报今日聚焦七大热点：小红书发布FireRedTTS-2语音合成模型，显著提升自然度；百度文心ERNIE-4.5登顶Hugging Face榜单；谷歌Gemini应用登顶美国免费榜；马斯克xAI裁员500人并战略转型；OpenAI拟大幅降低与微软分成比例；DeepMCPAgent开源框架提升AI代理生产力；蚂蚁发布AI开源全景图2.0；北京1400多所中小学推行人工智能通识课程。

AI 对话合成模型小红书
GEO排名查询工具推荐:霸屏AI大模型答案的核心方法，做好AI大模型排名优化

随着AI大模型成为用户获取信息的主要入口，AIBase推出GEO排名查询工具，帮助品牌监测在豆包、DeepSeek、文心一言等主流AI平台中的曝光情况。该工具支持多平台检测、关键词追踪、可视化数据展示，可精准分析品牌是否被推荐、出现频次及具体场景，为制定AI大模型排名优化策略提供数据支撑。在GEO时代，抢占AI回答推荐位意味着获得全新流量入口。

AI大模型 GEO排名查询生成引擎优化
荐AI日报：蚂蚁开源高性能思考模型Ring-flash-2.0；通义7款模型屠榜Hugging Face；Veo3视觉能力升级

蚂蚁百灵团队开源高性能思考模型Ring-flash-2.0，在多项基准测试中表现优异；阿里通义7款模型登顶Hugging Face榜单，Qwen3-Omni凭借多模态能力全球第一。谷歌Veo3突破视频生成局限，可自动完成视觉任务；特斯拉推进人形机器人量产，马斯克称其为最重要产品。马斯克第六次起诉OpenAI窃取商业机密，苹果内部测试聊天机器人Veritas优化Siri，YouTube推出AI音乐主播增强互动，LiquidAI发布轻量级模型Liquid Nanos优化边缘计算。

AI 开源模型高性能思考模型
我国首个政务大模型安全国家标准发布百度深度参与制定

日前，我国首个针对政务大模型的安全国家标准《政务大模型应用安全规范》（下称《规范》）正式发布。百度作为核心参编单位，凭借其在人工智能安全及政务服务领域的深厚积累，深度参与了该标准的制定工作，为政务大模型的安全选用、部署运行、护栏建设和合规落地提供了专业支持。《规范》由国家工业信息安全发展研究中心牵头，联合百度等国内领先企业共同制定�

政务大模型安全国家标准百度参编
荐AI日报：美团发布推理大模型LongCat-Flash-Thinking；阿里Wan-Animate开源；字节推豆包翻译大模型

AI日报栏目聚焦人工智能领域最新动态。美团推出高性能推理大模型LongCat-Flash-Thinking；阿里开源Wan-Animate模型革新AI视频生成；字节跳动发布豆包翻译模型，支持28种语言互译；华为与浙大联合推出安全大模型DeepSeek-R1-Safe；阿里云即将发布跨模态模型Qwen3-Omni；xAI推出计算成本降低98%的Grok4Fast模型；YouTube发布多项AI创作辅助功能；IBM推出轻量级文档处理模型Granite-Docling-258M；中科院发布类脑大模型SpikingBrain实现百倍速度突破；OpenAI将推出仅限Pro用户的计算密集型新功能。

AI日报美团大模型 LongCat-Flash-Thinking
荐AI日报：小米开源首个原生端到端语音大模型；通义万相Wan2.2-Animate正式开源；Suno v5即将上线

AI日报今日聚焦多项技术突破：小米开源首个端到端语音大模型Xiaomi-MiMo-Audio；通义万相推出全新动作生成模型Wan2.2-Animate；Suno即将发布革命性音乐模型v5；生数科技获数亿融资，视频生成技术商业化加速。同时关注OpenAI修复ChatGPT安全漏洞，谷歌将Gemini集成至Chrome浏览器，Luma AI发布支持16位色的Ray3视频生成模型，法国Mistral推出开源推理模型Magistral Small 1.2，Notion发布AI智能体，腾讯混元3D Studio提升3D创作效率。

AI 语音大模型小米开源
考拉悠然开源悠然无界大模型BLM-1.0，以空间智能引擎驱动产业变革

9月28日，在成都举行的“2025天府人工智能产业生态大会”上，考拉悠然宣布其自主研发的“悠然无界大模型BLM-1.0”完成迭代升级并全面开源，同时发布基于该模型的UU Holo Glass O1 AR工业眼镜。此举标志着公司以“技术开源+场景落地”双轮驱动策略，推动空间智能产业生态共建。BLM-1.0突破传统模型局限，具备跨空间、跨任务、跨本体的“三跨”统一能力，在空间理解、推理与执行三大核心能力上刷新行业纪录。配套AR眼镜深度融合空间感知与多模态交互，实现工业运维、安装巡检等场景的全程自动化与智能辅助，显著提升效率并降低成本。

人工智能开源大模型空间智能
小度发布多模态智能摄像机，AI大模型重塑家庭看护体验

小度科技推出首款多模态智能摄像机C800，搭载800万像素4K超清摄像头，支持AI大模型技术。该产品不仅能实现高清监控，还具备智能行为识别、语音交互等功能，可自定义看护提醒。结合视觉与语音交互，支持复杂语义查询和家庭设备联动，扩展智能家居应用场景。目前产品已全网发售，年底还将推出三摄版本，持续探索AI硬件创新。

AI大模型智能硬件小度科技

今日大家都在搜的词：

热文

3 天
7天

「6月30日AI日报」百度开源文心大模型4.5系列；通义千问发布多模态生成模型Qwen VLo

荐AI日报：阿里推多模态模型Qwen3-Omni；谷歌推出AP2协议；百度推出Qianfan-VL 模型

荐AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型；Claude Sonnet4.5发布

荐AI日报：小红书发布对话合成模型 FireRedTTS-2；百度文心新模型登顶Hugging Face榜首；xAI将裁员500人

GEO排名查询工具推荐:霸屏AI大模型答案的核心方法，做好AI大模型排名优化

荐AI日报：蚂蚁开源高性能思考模型Ring-flash-2.0；通义7款模型屠榜Hugging Face；Veo3视觉能力升级

我国首个政务大模型安全国家标准发布百度深度参与制定

荐AI日报：美团发布推理大模型LongCat-Flash-Thinking；阿里Wan-Animate开源；字节推豆包翻译大模型

荐AI日报：小米开源首个原生端到端语音大模型；通义万相Wan2.2-Animate正式开源；Suno v5即将上线

考拉悠然开源悠然无界大模型BLM-1.0，以空间智能引擎驱动产业变革

小度发布多模态智能摄像机，AI大模型重塑家庭看护体验

今日大家都在搜的词：

热文

苹果iOS18.7.1正式版更新发布重要安全修复

OPPO A6开售：售价1599元起搭载7000mAh六年长寿电池

AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型

罗永浩替小米说公道话：海报小字是行业陋习

腾讯QQ闪传功能上线支持单文件最大10GB传输

苹果iOS 26.0.1正式版发布：修复iPhone 17系列Wi-Fi、拍照等Bu

OPPO Find X9系列定档：10月16日发布

王腾小红书账号注销快手账号已被封禁抖音账号已私密视频号已

鸿蒙智行享界S9T上市13天大定破 15000 台

鸿蒙智行9月交付新车52916台：全系累计交付突破95万台

小米17破今年国产手机首销纪录卢伟冰：需求远超预期

苹果iOS18.7.1正式版更新发布重要安全修复

苹果将推出iPhone 17e：搭载A19 芯片支持灵动岛

OPPO A6开售：售价1599元起搭载7000mAh六年长寿电池

AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型

小米17系列开售5分钟破25年国产手机首销纪录

AI日报：蚂蚁开源高性能思考模型Ring-flash-2.0；通义7款模型屠

AI日报：腾讯重磅发布混元图像3.0；快手发布KAT系列Agentic Co

罗永浩替小米说公道话：海报小字是行业陋习

iPhone调休闹钟上热搜苹果客服回应：需手动设置

站长商机