首页 > 原创 > 关键词  > AI日报最新资讯  > 正文

「6月30日AI日报」百度开源文心大模型4.5系列;通义千问发布多模态生成模型Qwen VLo

2025-06-30 16:34 · 稿源:站长之家

欢迎来到AIbaseAI日报栏目!

每天三分钟了解当日AI大事件,助你洞悉AI行业趋势、创新AI产品应用。

更多AI资讯访问:https://www.aibase.com/zh

1.百度重磅开源文心大模型4.5系列,十款新模型亮相!

image.png

百度正式发布文心大模型4.5系列并完全开源,包含多种参数配置的十款新模型,使用飞桨框架训练推理,FLOPs利用率47%,在文本多模态基准测试中表现优异,提供一站式使用指南和工具,方便开发者精调部署,已上传至Hugging Face、GitHub等平台。

体验地址:https://yiyan.baidu.com

Hugging Face:https://huggingface.co/baidu)

GitHub:https://github.com/PaddlePaddle/ERNIE

2.通义千问发布多模态统一理解与生成模型Qwen VLo

微信截图_20250628093705.png

Qwen VLo多模态大模型发布,基于Qwen-VL系列升级,采用渐进式生成方式,精准看懂世界并高质量再创造,支持开放指令编辑修改生成,具备多语言指令能力,可进行图文输入输出,目前处于预览阶段,体验地址为Qwen Chat平台。

体验地址:chat.qwen.ai

3.阿里Ovis-U1震撼发布:多模态AI三合一,开源赋能全球开发者

image.png

阿里巴巴国际AI团队发布Ovis-U1多模态大模型,3亿参数,集成多模态理解、文生图像和图像编辑功能,采用创新架构设计,基于Python3.10等技术栈构建,训练中引入合规性检查算法,代码模型权重等已公开,助力多领域应用。

项目:(https://huggingface.co/AIDC-AI/Ovis-U1-3B)

4.华为开源盘古7B稠密和72B混合专家模型

华为开源盘古7B稠密模型、72B混合专家模型及升腾推理技术,践行升腾生态战略,推动大模型技术研究与行业应用,相关模型权重代码已上线开源平台,邀请开发者等下载使用反馈。

5.一张图即可生成爆款视频!美图MOKI「AI创意广告」限时免费

微信截图_20250630083834.png

美图MOKI推出“AI创意广告”功能,用户上传图片选择模板即可生成专业级视频,集成七大主流视频生成模型,体验地址为www.moki.cn,可完成从创意到成片的完整流程。

体验地址:www.moki.cn

6.Gemini2.5Pro API 免费回归,开发者社区热烈响应

QQ20250630-104007.png

谷歌Gemini2.5Pro API重新纳入Google AI Studio免费层级,该模型多模态和推理能力强,支持多种输入类型,此次免费回归为开发者提供创新机会,免费计算资源翻倍,社区反应积极。

7.豆包「深入研究」功能在豆包APP、网页版及电脑版开启测试

微信截图_20250630140622.png

豆包APP等平台开启「深入研究」功能测试,可整合海量深度信息生成研究报告或可视化网页结果,用户输入指令几分钟获定制化报告,还支持一键转播客形式。

8.小米“AI百宝箱”内测期结束,7月5日起停止服务

006Q2YfWgy1i2x8ss8nr1j314016sjxl.jpg

小米“AI百宝箱”内测结束,计划7月5日暂停服务,内测收集了数据反馈,非放弃项目而是进行数据整理等战略规划,小米在AI领域持续投入探索构建多层次全场景AI生态。

9.新开源 AI 系统 OmniGen2:像GPT-4o 一样融合了图像和文本生成

image.png

北京人工智能研究院推出OmniGen2开源系统,专注文本图像生成编辑等,采用独立解码路径,基于Qwen2.5-VL-3B变换器,使用自定义扩散变换器,有反思机制,性能在多个基准测试中出色,将发布到Hugging Face平台。

项目:https://huggingface.co/OmniGen2/OmniGen2

10.知乎“直答”升级知识库功能,深度融合社区内容打造沉浸式AI问答体验

知乎“直答”升级知识库功能,深度融合社区内容,带来沉浸式阅读等创新功能,旨在提供沉浸式多场景AI问答体验,扩大答主内容影响力,降低用户查询成本。

举报

  • 相关推荐
  • AI日报:通义千问开源Qwen3向量模型;字节跳动图像编辑模型SeedEdit 3.0;ElevenLabs推v3语音模型

    本文汇总了近期AI领域的重要动态:1)通义千问发布Qwen3-Embedding系列模型,在多语言文本处理表现优异;2)字节跳动推出图像编辑模型SeedEdit3.0,提升细节保持能力;3)ElevenLabs发布情感语音合成系统Eleven v3 Alpha;4)Anthropic推出面向国家安全的Claude Gov模型;5)可灵AI月收入连续两月超1亿元;6)Meta公布智能眼镜Aria Gen2技术细节;7)爱诗科技上线AI视频工具"拍我AI";8)富国银行预测2030年ChatGPT广告收入将达千亿美元。

  • @开发者们:百度文心大模型4.5系列模型开源,国内首发平台GitCode现已开放下载!

    6月30日,百度文心大模型4.5系列正式开源并在国内领先的开源平台GitCode首发上线。该系列包含10款模型,涵盖47B和3B参数的混合专家(MoE)模型及0.3B的稠密参数模型,采用创新的多模态异架构结构实现跨模态知识融合。模型基于飞桨框架开发,训练效率达47% MFU,在文本和多模态基准测试中达到SOTA水平。所有模型按Apache2.0协议开源,配套产业级开发套件支持多种芯片部署。GitCode平台已汇聚620万用户,为AI开发者提供代码托管、协同开发等全流程支持。此次开源将推动中国AI生态创新,加速大模型技术产业化应用。

  • AI日报:通义千问3大模型全球爆火;即梦图片3.0智能参考全量上线;智谱AI企业级超级助手Agent CoCo上线

    【AI日报】今日AI领域重要动态:1.通义千问3大模型全球下载量超1250万,衍生模型13万+;2.即梦图片3.0上线,AI设计进入"零门槛"时代;3.智谱AI发布企业级超级助手Agent CoCo;4.百度推出金融行业大模型"千帆慧金";5.小红书开源首个大模型dots.llm1,含1420亿参数;6.Hugging Face开源LeRobot项目,降低机器人研发门槛;7.ChatGPT语音功能升级,支持更自然对话翻译;8.Google Gemini应用下载量超ChatGPT但活跃度不足;9.轻量级文档解析模型MonkeyOCR表现优异;10.Google Veo3推出高速视频生成模式;11.Google调整AI Studio政策,限制Gemini2.5Pro免费访问。

  • 极氪接入通义千问3,知识库问答命中率达98%

    极氪汽车接入通义千问3大模型,打造专属知识库"极氪知道",问答准确率达98%。基于阿里云平台调用Qwen3-235B-A22B大模型,构建图文视三位一体的知识呈现系统,可提供标准化文本介绍及多媒体资源。通义千问3的快慢思考融合架构能提供更富逻辑性的车辆对比介绍,提升客户决策体验。极氪车联网、APP等核心业务已运行在阿里云平台。

  • 「6月27日AI日报」腾讯开源轻量级混元-A13B模型;可灵AI推“视频音效”功能

    AI日报主要内容: 1. 腾讯开源混元A13B模型,采用MoE架构,总参数量800亿,激活参数130亿,支持低端GPU部署 2. 可灵AI推出"视频音效"功能,实现所见即所听的沉浸体验 3. Black Forest开源图像编辑模型FLUX.1Kontext,支持消费级硬件运行 4. OpenAI发布Deep Research API新模型o3/o4-mini,支持自动化网页搜索和数据分析 5. 小米推出1999元起AI眼镜,集成拍摄、支付、音乐等功能 6. 迅雷推出下载MCP服务,一句话指令让AI自动完成下载任务 7. HeyGen推出AI视频Agent,几分钟内生成专业级视频内容 8. 谷歌开源端侧多模态大模型Gemma3n,手机也能运行云端AI性能

  • AI日报:MiniMax-M1开源;阿里Qwen3升级版适配苹果MLX架构;月之暗面发布新模型Kimi-Dev-72B

    《AI日报》汇总了近期AI领域多项重要进展:1)月之暗面推出开源编程模型Kimi-Dev-72B,在软件工程任务测试中创下新纪录;2)MiniMax开源M1模型,支持超长上下文推理且训练成本低;3)腾讯发布AI音乐模型LeVo,支持音色克隆和分轨生成;4)阿里云Qwen3升级版适配苹果MLX架构;5)豆包推出"AI播客"功能,可将PDF转为对话播客;6)夸克App上线个性化AI家教"夸克老师";7)松下发布多模态大模型OmniFlow,实现文本/图像/音频自由切换;8)TikTok推出三款AI视频创作工具;9)极氪与火山引擎合作,将豆包大模型接入智能座舱系统;10)Meta的Llama3.1模型在文本记忆方面表现突出;11)Grok上线定时追踪X热门话题功能;12)Gemini2.5Pro即将更新Deep Think功能;13)谷歌地图引入AI技术升级导航和个性化推荐功能。

  • AI日报:MiniMax发布视频智能体Hailuo Agent;昆仑万维开源 Skywork-SWE-32B;B站接入Qwen 3等模型

    本期AI日报聚焦多项AI领域创新:1)MiniMax推出视频Agent工具,支持文本生成高清视频及人脸驱动;2)昆仑万维开源Skywork-SWE-32B模型,提升软件工程任务表现;3)B站接入通义千问模型,推出数据分析智能体InsightAgent;4)ChatGPT深度整合Gmail与日历功能;5)腾讯云发布全链路AI开发平台"AI Builder";6)HeyGen推出UGC广告数字人功能;7)研究显示过度依赖AI或削弱批判性思维。此外还涵盖AI音乐生成、内容检测工具停运等动态,展现AI技术快速发展的多元应用与潜在影响。

  • 华为官宣6月11日召开新品发布会 WATCH 5系列将亮相

    华为将于6月11日举办新品发布会,推出Pura80系列手机和WATCH5系列智能手表。WATCH5系列是首款搭载鸿蒙AI系统的智能手表,预装鸿蒙操作系统5,在安全、流畅度和智能化方面表现突出。该系列手表已在海外率先发布,提供42mm和46mm两种尺寸,售价2699-3999元,可享最高500元国家补贴。作为全球首款支持星闪技术的智能手表,WATCH5能与尊界S800实现高精度车钥匙功能,定位精度达传统方案的5倍以上。此外,WATCH5还首次搭载X-TAP传感器,集成PPG、ECG和10级触摸传感器,可实现实时血氧监测等健康功能。

  • 算力赋能营销革新,东信云与华为云签约共建多模态大模型应用标杆

    6月21日,东信云与华为云在HDC2025大会上签署合作协议,双方将基于昇腾AI云服务深化合作,重点布局多模态大模型应用与数字人技术。合作内容包括:1)构建智能营销系统,整合文本、图像、视频等多元数据,提升市场分析和消费者行为预测能力;2)通过大模型实现营销内容自动化生成,包括新闻稿、社交媒体帖子和广告文案;3)优化大模型架构,提升训练和推理效率。东信云6月发布的"数字人智能引擎"已实现分钟级生成逼真数字人,显著提升推荐转化率。双方还将联合行业伙伴共建营销大模型生态系统,推动营销行业智能化升级。

  • AI日报:即梦灰测图片3.1模型;ElevenLabs推出AI语音助理11ai;百度发布多智能体协同AI IDE

    本文介绍了AI领域多项最新进展:1)即梦灰测图片3.1模型增强电影感和艺术风格;2)ElevenLabs推出语音助手11ai;3)文心快码发布多模态AI开发工具Comate AI IDE;4)苹果采用"归一化流"技术开发新型AI生图模型;5)Grok将推出整合多类型文件管理功能;6)OmniGen2开源多模态模型重塑AI应用场景;7)ScholAI革新学术研究工具;8)豆包推出可视化AI编程功能;9)饿了么推出骑手AI助手"小饿";10)张雪峰认为AI可替代部分教育工作;11)微软发布3.3亿参数小模型Mu。这些创新展示了AI技术在各领域的快速发展和应用潜力。