首页 > 业界 > 关键词  > AI技术发展最新资讯  > 正文

李彦宏:开源模型会越来越落后 小尺寸模型效果更好成本更低

2024-04-16 10:50 · 稿源:站长之家

站长之家(ChinaZ.com)4月16日 消息:在Create2024百度AI开发者大会上,百度创始人、董事长兼首席执行官李彦宏分享了他对于AI技术发展趋势的独特见解。他明确指出,开源模型在当前的AI发展中正逐渐显露出其局限性,预示着其可能逐渐落后于时代。

李彦宏进一步强调,基于百度强大的基础模型——文心4.0,用户可以结合效果、响应速度及推理成本等多维度因素,灵活剪裁出适用于不同场景的小尺寸模型。相较于直接使用开源模型调整得到的模型,这些定制的小模型在同等尺寸下展现出了更为显著的效果优势;而在同等效果下,其成本则明显更为低廉。

百度,搜索 (3)

为了生动展示这一优势,李彦宏在大会上与小度进行了实时互动,演示了小度如何运用多个模型组合的方式高效执行各种任务。例如,在处理模型路由工作时,小度采用了轻量级的小模型ERNIE Tiny;而对于日程安排等复杂需求,则调用了性能卓越的文心4.0大模型。这一组合策略使得小度在响应速度上实现了2倍的提升,同时成本降低了惊人的99%,相较于全部采用文心大模型的旗舰版而言,其性价比和实用性均得到了显著提升。

李彦宏的发言不仅揭示了AI技术发展的新趋势,也展示了百度在AI领域的深厚积累和创新能力。通过灵活应用文心4.0等基础模型,百度正致力于推动AI技术的更广泛应用,以满足不同场景下的多元化需求。

举报

  • 相关推荐
  • 淘宝,越来越“膨胀”了

    无意间打开淘宝,为何容易在其中迷失? 这也许是因为,淘宝除了线上购物之外,正拥有越来越多的其他功能。 比如,有位网友出差途中,iPad屏幕出现损坏,线下维修容易被坑,线上维修时间太久,该怎么办? 为此,他在淘宝花费200多元,下单了iPad屏幕维修服务,商家不仅做到了及时上门取货,还在网上开启了维修直播,等于给工作室装上了云监控,打消了用户的一切疑虑�

  • 争夺大消费入口:阿里、京东、美团越来越像

    「饿了么、飞猪并入阿里电商,统归蒋凡管理」,「美团关停大部分团购业务、全面聚焦即时零售和社区零售」,「刘强东强调京东要用供应链思路把外卖、酒旅等本地生活品类重新做一遍」,如果把这几件不到一周内相继发生的事情连起来看,答案只能是——阿里、美团、京东变得越来越像。 这种像,体现在美团不仅已经依靠本地商流和本地物流形成了万物到家和吃喝玩乐

  • 有道14B低成本轻量模型“子曰3”开源,数学推理性能超越大模型

    网易有道6月23日开源国内首个专注数学教育的"子诳3"大模型系列数学模型(Confucius3-Math)。该模型在单块消费级GPU上高效运行,在多项数学推理任务中性能超越更大规模的通用模型,高考数学题测试得分达98.5分。其训练成本仅2.6万美元,推理性能是DeepSeek+R1的15倍,服务成本低至每百万token0.15美元,大幅降低教育AI应用门槛。该开源模型为教育公平提供低成本、高性能的AI�

  • 空姐、法医月涨粉10万+,小红书的职业化内容为什么越来越火?

    ​最近,小红书平台上,“职业人+日常vlog”类型内容成为爆款。 例如,空姐账号@厦门航空‑林佳 以“真诚是我的必杀技”标榜自己,从飞机起飞前准备、机上服务流程,到延误处理、驻外岗位的城市生活,她的每条作品点赞几乎都破万,5月更是涨粉10万+,粉丝总数超过47万。 另一位韩国籍空姐@韩国空姐佳娟 ,通过与观众分享从韩国飞往各地的航班线路与空乘故事,同样�

  • AI日报:通义千问开源Qwen3向量模型;字节跳动图像编辑模型SeedEdit 3.0;ElevenLabs推v3语音模型

    本文汇总了近期AI领域的重要动态:1)通义千问发布Qwen3-Embedding系列模型,在多语言文本处理表现优异;2)字节跳动推出图像编辑模型SeedEdit3.0,提升细节保持能力;3)ElevenLabs发布情感语音合成系统Eleven v3 Alpha;4)Anthropic推出面向国家安全的Claude Gov模型;5)可灵AI月收入连续两月超1亿元;6)Meta公布智能眼镜Aria Gen2技术细节;7)爱诗科技上线AI视频工具"拍我AI";8)富国银行预测2030年ChatGPT广告收入将达千亿美元。

  • @开发者们:百度文心大模型4.5系列模型开源,国内首发平台GitCode现已开放下载!

    6月30日,百度文心大模型4.5系列正式开源并在国内领先的开源平台GitCode首发上线。该系列包含10款模型,涵盖47B和3B参数的混合专家(MoE)模型及0.3B的稠密参数模型,采用创新的多模态异架构结构实现跨模态知识融合。模型基于飞桨框架开发,训练效率达47% MFU,在文本和多模态基准测试中达到SOTA水平。所有模型按Apache2.0协议开源,配套产业级开发套件支持多种芯片部署。GitCode平台已汇聚620万用户,为AI开发者提供代码托管、协同开发等全流程支持。此次开源将推动中国AI生态创新,加速大模型技术产业化应用。

  • 模型推理协作正式开启,魔乐社区,让模型跑遍“中国芯”

    魔乐社区启动"模型推理适配协作计划",旨在解决国产算力平台与大模型间的适配难题。该计划通过开源协作模式,联合开发者、芯片厂商等生态伙伴,构建从工具链到知识库的全栈支持体系,打造适配成果共享平台。重点支持开源大模型在国产硬件及多样化推理引擎上的高效运行,提供模型转换工具和优化指南,降低开发门槛。目前已有文心大模型4.5等首批适配成果上线,并联合多家国产芯片厂商共建测试资源和技术支持体系。该计划将推动国产算力自主化,重塑开源AI生态协同范式,加速大模型在国产平台的迁移应用进程。

  • 苹果自研AI模型难产:改用第三方大语言模型

    苹果可能会跟OpenAI或Anthropic合作,双方正在谈判讨论一项潜在交易,苹果希望调用OpenAI或Anthropic的第三方大语言模型来为Siri提供技术支持。 据悉,OpenAI或Anthropic正在训练适配苹果私有云计算服务器的模型,苹果也在进行测试,目前苹果发现Anthropic的AI模型最适合Siri,且与Anthropic初步讨论了一些财务条款,消息称Anthropic要求苹果每年支付数十亿美元的费用,且该费用会随时间�

  • 国内有哪些ai大模型?一文看懂中国核心AI大模型全景

    近两年中国AI大模型发展迅猛,已形成"通用+行业"双轨并进的生态格局。百度文心一言、阿里通义千问等通用大模型在中文理解、多模态生成等方面表现突出;深度求索DeepSeek以1/10参数实现GPT-4级推理能力;月之暗面Kimi以20万汉字上下文窗口领跑长文本处理;智谱AI的GLM-4成为首个支持视频对话的国产千亿模型。医疗、金融等垂直领域涌现出百川智能等专业模型,覆盖超1000家医院。开源生态加速国产芯片适配,15家厂商完成深度优化。行业应用方面,工程文档效率提升60%,24小时拟人化客服等案例凸显价值。未来趋势呈现模型蒸馏、端侧部署和开源生态三大方向,中国AI正从实验室走向产业变革前沿。

  • 预测大模型的工业生存法则,华为博士告诉你什么才是B端最需要的大模型!

    华为开发者大会2025期间,AI专家李良基与华为团队围绕预测大模型展开深度对话。华为提出"数据原子级表征体系"理念,旨在通过统一数据编码解决跨场景迁移难题。预测大模型已在钢铁行业成功应用,温度预测准确率远超传统方案。专家指出,AGI发展的核心在于构建知识迁移能力,未来将聚焦To B场景落地,通过统一架构实现跨领域泛化应用。华为云首创Triplet Transformer