首页 > AI头条  > 正文

百度重磅开源文心大模型 4.5 系列,十款新模型亮相!

2025-06-30 11:21 · 来源: AIbase基地

百度正式发布了文心大模型4.5系列模型,并且将其完全开源。用户可以通过文心一言(https://yiyan.baidu.com)立即体验这一最新的开源技术。

这一系列模型涵盖了多种参数配置,包括激活参数为47B 和3B 的混合专家(MoE)模型,以及稠密型模型0.3B 参数的设计,合计达到了十款不同的模型。

image.png

在训练和推理方面,文心4.5系列模型使用了飞桨深度学习框架,达到47% 的模型 FLOPs 利用率。实验结果显示,该系列模型在多项文本和多模态基准测试中表现优异,尤其是在指令遵循、世界知识记忆、视觉理解和多模态推理等任务上,取得了 SOTA(state-of-the-art)水平的成绩。

image.png

文心4.5系列模型的权重根据 Apache2.0协议开源,允许进行学术研究和产业应用。此外,飞桨还提供了开源的产业级开发套件,兼容多种硬件,降低了后训练和部署的门槛。

为了便于开发者使用,文心4.5系列还提供了一站式使用指南,包括如何快速掌握模型的精调和对齐。开发者可以通过 ERNIEKit 和 FastDeploy 等工具,轻松实现模型的训练和部署。FastDeploy 支持多种硬件平台,提供高性能、低门槛的推理部署体验。

image.png

此次开源不仅包括了模型的预训练权重和推理代码,还在多个平台上提供了下载和部署服务。用户可以在飞桨星河社区和 HuggingFace 等知名平台上找到并使用这些模型。值得注意的是,百度还推出了开放模型的 API 服务,用户可在百度智能云的千帆大模型平台上进行调用和使用。这意味着,无论是研究人员还是开发者,都能更方便地接触到最新的 AI 技术。

文心4.5系列模型的开源包含了预训练权重和推理代码,所有项目已被上传至:

 Hugging Face(https://huggingface.co/baidu)、

GitHub(https://github.com/PaddlePaddle/ERNIE)

飞桨星河社区(https://aistudio.baidu.com/overview)。

如果需要深入了解技术细节,用户可下载技术报告(https://yiyan.baidu.com/blog/publication)进行查阅。

划重点:  

🌟 文心4.5系列模型于6月30日正式开源,提供10款不同版本的模型。  

📈 模型采用创新的多模态异构架构,提升多模态理解能力。  

🛠️ 开发者可通过 ERNIEKit 和 FastDeploy 工具,快速进行模型的训练和部署。  

  • 相关推荐
  • AI日报:智谱AI重磅发布GLM-4.5;阿里开源Wan2.2;阶跃星辰推全新模型Step3

    【AI日报】本期重点内容:1.智谱AI发布开源大模型GLM-4.5,在推理、编码和智能体能力方面达到SOTA水平;2.阿里开源视频生成模型Wan2.2,采用MoE架构提升计算效率;3.阶跃星辰推出AI研究助手"阶跃深研",支持金融医疗等专业领域研究;4.微软Edge浏览器新增Copilot模式,提供智能搜索体验;5.Anthropic对Claude用户实施使用限制引发争议;6.阶跃星辰发布321B参数大模型Step3;7.蚂�

  • TDBC大会揭幕:百度智能云再造数据与AI新连接,激活大模型生命线

    中国通信标准化协会等机构联合主办的"TDBC2025可信数据库发展大会"在京召开。会上公布了上半年"可信数据库"评估测试结果,百度智能云向量数据库VectorDB成为国内首批完成测试的向量数据库产品。该测试覆盖稠密向量检索、多向量检索、标量向量融合检索三种场景,评估指标包括索引构建时间、QPS、延迟、资源占用等多个维度。百度智能云总架构师朱洁指出,超过50%的AI项目时间消耗在数据治理环节,提出构建"智能数据基座"实现数据统一管理,形成"Data+AI+App"闭环。百度智能云通过湖仓一体架构提升AI训练数据效率,智能调度CPU/GPU算力优化资源分配,预计到2028年多数生成式AI应用将直接基于企业数据平台构建。

  • 荣耀MagicGUI大模型发布并开源!Magic V5首发搭载:跨应用/设备自动化

    该战略是荣耀新任CEO李健在3月的MWC 2025首次揭晓,是荣耀的全新人工智能战略计划,将从智能手机制造商向全球AI终端生态公司全面转型。 李健宣布,未来5年荣耀将投入100亿美元,与全球合作伙手共建AI设备生态。 分为三个实施阶段: 第一阶段是智慧手机,荣耀将与合作伙伴携手突破技术边界,共同创造代理型人工智能时代的新范式; 第二阶段是智慧生态系统,荣耀将打�

  • 如何精准锁定高性价比的AI大模型?AIbase AI模型费用计算器助力开发者省心省钱选模型

    文章探讨了在预算有限的情况下如何选择合适的大模型API。面对GPT-4、Claude2、Llama2等数十种模型,开发者常陷入选择困境:既要考虑性能,又要兼顾成本。不同厂商的计费机制复杂多样(按Token、请求次数或时间),手动计算耗时且容易出错。文章推荐使用AIbase的AI模型费用计算器,该工具聚合主流模型定价数据,支持可视化交互计算,能快速比较不同场景下的使用成本,帮助�

  • 猿辅导AI大模型:技术深融与场景革新,重构学习体验

    2025年教育科技领域迎来智能化新浪潮。猿辅导集团通过自主研发的"猿力大模型"与开源推理大模型DeepSeek深度融合,构建覆盖"数据-场景-交互"全链路的AI教育生态。其技术方案已获信通院"模型开发5级"认证,成为教育行业首个获此最高评级的大模型。硬件方面推出"小猿学练机"和"小猿AI学习机",实现学习平板与智能基座结合,支持打印、情感交互等功能。校园端覆盖25省市超1000所学校,通过"AI安全驾驶模拟"等项目培养学生计算思维。编程教育领域推出支持代码实时监测的AI-Agent工具。凭借300亿条学情数据和15亿题库构建的高质量素材库,显著降低"幻觉"风险68%。目前旗下出海产品已服务100多个国家,推动中国教育科技走向国际。

  • 大模型对比评测:Qwen2.5 VS Gemini 2.0谁更能打?

    本文对比分析了四款AI大模型:Gemini2.0Flash-Lite(Preview)、Gemini2.0Flash(Experimental)、Gemini2.0Pro Experimental(Feb25)和Qwen2.5Coder Instruct32B。Gemini2.0Flash-Lite适合高并发低延迟应用,Gemini2.0Flash擅长实时多模态推理,Gemini2.0Pro适合复杂编程任务,Qwen2.5Coder在代码任务上性价比突出。建议使用AIbase模型广场进行高效筛选,该平台覆盖上万款AI模型,提供性能、价格等多维度直观对比,支持按任务类型、语言等精准筛选,并持续更新最新模型。

  • 腾讯混元3D世界模型在魔搭社区开源首发

    7月27日,腾讯混元3D世界模型1.0在魔搭社区开源首发。这是业界首个开源的沉浸式3D世界生成模型,支持文字/图片输入快速生成完整3D场景,将原本需要数周的建模时间缩短至几分钟。该模型显著提升了游戏开发、VR、数字内容等领域的创作效率,开发者可免费下载体验,还能通过魔搭社区提供的4000+MCP服务和调试工具进行优化训练。作为中国最大AI开源社区,魔搭已汇聚500+机构、7万+模型,覆盖36个国家1600万开发者。此前腾讯开源的混元MoE模型Hunyuan-A13B也在该社区首发。

  • 聚焦WAIC 2025 | 携全双工语音通话大模型亮相,Soul App重塑人机互动新范式

    Soul App在2025世界人工智能大会上展示了AI社交创新方案,重点呈现了全双工语音/视频通话大模型技术。该技术突破传统"轮次对话"模式,赋予AI自主决策对话节奏的能力,实现更自然的人机互动。平台通过"AI社交练习"主题,展示了AI在群聊派对中的主持能力,能有效活跃气氛、鼓励用户参与。同时,Soul还探索了多模态交互,基于全双工语音和实时视频生成技术,构建"数字人格"促进深度社交连接。作为社交平台,Soul持续深化AI与社区融合,通过智能推荐和虚拟人生态,为用户提供即时情感支持和共鸣,推动社交向"情感共生"进化。CTO陶明表示,AI正深入个体关系网络,将拓展"情价比消费"等全新市场机会。

  • 工业大模型进入能力正赛,权威评测北电数智骄阳·工业大模型拿下综合排名第一

    国产工业大模型正从概念热潮走向应用深水区。7月24日,SuperCLUE发布中文工业大模型评测基准SC-Industry最新榜单,北电数智"骄阳·工业大模型"以83.44分获综合第一,在应用能力(90.07分)、工业数据分析(90.38分)和工业智能体(89.97分)三个细分维度均居榜首。报告指出,产业级应用能力成为新分水岭,国产模型在工业任务能力方面实现突破。北电数智通过建立工业数据标准体系、研发场景化微调数据生成技术等举措,构建了精准垂类认知、高质量数据治理和合规管控机制三大优势。该模型将亮相2025世界人工智能大会,分享"AI+生产"等核心场景的创新实践。

  • A日报:Trae 2.0 正式升级 SOLO 模式;通义发布Qwen3新模型;智谱AI重磅推出Zread

    本期AI日报聚焦多项AI领域突破:1)Trae 2.0推出SOLO模式,实现AI全流程自主开发;2)阿里通义发布Qwen3-235B大模型,支持256K文本处理;3)智谱AI推出Zread工具,一键转换GitHub项目为使用手册;4)零一万物发布万智企业大模型平台2.0及定制Agent方案;5)字节跳动推出通用机器人模型GR-3,具备高精度操作能力;6)Pika推出AI视频特效APP,降低创作门槛;7)Dia浏览器将上线AI驱动的"分身鼠标&

今日大家都在搜的词: