首页 > 业界 > 关键词  > 中文SEO优化最新资讯  > 正文

谷歌的人工智能大型语言模型 PaLM 2 在训练中使用的文本数据是其前身的近五倍

2023-05-18 09:12 · 稿源:站长之家

站长之家(ChinaZ.com) 5月18日消息:据 CNBC 披露,谷歌上周宣布的新型大型语言模型 PaLM 2 使用的训练数据量几乎是 2022 年前身的 5 倍,可执行更高级的编码、数学和创意写作任务。据 CNBC 获悉,谷歌的新通用大型语言模型(LLM)PaLM 2 已训练了 3.6 万亿个 token。而 token 是单词字符串,是训练 LLM 的重要组成,因为它们使模型能够预测序列中接下来出现的单词。

PaLM 2,谷歌,人工智能,AI,大型语言模型

过去谷歌的 PaLM 使用了 7800 亿个 token,虽然谷歌一直渴望展示其人工智能技术的强大功能以及如何将其嵌入搜索、电子邮件、文字处理和电子表格中,但公布训练数据量及其它细节方面一直非常保密。微软支持的 ChatGPT 的创建者 OpenAI 也保密其最新的 LLM GPT-4 的细节。

两家公司都表示,不公开训练数据等细节是因为业务竞争的原因,但研究界呼吁进行更大的透明度。自公布 PaLM 2 以来,谷歌已表示新模型比以前的 LLM 更小,这表明谷歌的技术正在变得更加高效,同时可以完成更复杂的任务。PaLM 2 据内部文档所示,已经训练了 3400 亿个参数,是模型复杂性的指标。而初始的 PaLM 则是训练了 5400 亿个参数。至于 PaLM 2 的训练数据具体来自哪里,谷歌发言人拒绝发表评论。

据谷歌在 PaLM 2 的博客文章中表示,这种新技术称为「compute-optimal scaling」,通过这种方法,LLM 运行效率更高,性能更好,包括更快的推理、更少的服务参数以及更低的服务成本。谷歌证实 PaLM 2 已经训练了 100 种语言,并且可以执行广泛的任务,已经被用于推动 25 个功能和产品,包括谷歌的实验性聊天机器人 Bard。它提供四种大小的选择,从最小的 Gecko 到最大的 Unicorn。

众所周知,PaLM 2 比现有任何模型都更强大,在公开披露的数据中如此。Facebook 的 LLM 称为 LLaMA,是在今年 2 月宣布的,使用了 1.4 万亿个 token 训练。上一次 OpenAI 披露 ChatGPT 的训练规模是在 GPT-3 时,当时公司表示它使用了 3000 亿个 token,而现在 OpenAI 在 3 月份推出了 GPT-4,并表示该模型在许多专业测试中达到了「人类水平的表现能力」。

如今,随着新的 AI 应用快速走向主流,围绕 AI 的争议也变得越来越激烈。谷歌的高级研究科学家 El Mahdi El Mhamdi 在 2 月份因公司缺乏透明度而辞职。周二,OpenAI 首席执行官 Sam Altman 在参议院隐私和技术小组的听证会上作证,同意议员们需要一个处理 AI 的新系统。「对于这项非常新的技术,我们需要一个新的框架,」Altman 说:「像我们这样的公司肯定要对我们在世界上推出的工具负起很大的责任。」

举报

  • 相关推荐
  • 小米电视怎么无线投屏?怎么搜索到设备?超全教程分享,新老电视都适用

    本文介绍小米电视投屏教程,推荐使用当贝投屏软件。详细讲解软件下载安装步骤,支持多种设备连接方式,兼容AirPlay、DLNA等协议。提供常见问题解决方案,如网络连接失败、画面卡顿等。新手也能轻松操作,实现流畅投屏体验,适用于观影、办公等多种场景。

  • AI日报:昆仑万维发布SkyReels-A3模型;百度搜索PC端全面上线AI搜索;Grok 4 AI模型永久免费开放

    AI日报栏目聚焦人工智能领域最新动态:1)昆仑万维发布SkyReels-A3模型,实现语音驱动数字人生成;2)xAI宣布Grok4模型永久免费开放;3)OpenAI发布GPT-5提示词指南;4)百度PC端上线AI搜索功能;5)微软Windows Co pilot接入GPT-5;6)百川智能开源医疗大模型Baichuan-M2性能超越GPT-oss120b;7)苹果iOS26将集成ChatGPT-5;8)谷歌推出3D视觉编辑框架BlenderFusion;9)轻量级TTS模型Kitten TTS参数仅1500万;10)MiniCPM-V

  • 百度搜索PC端全量上线AI功能

    百度对外宣布其搜索PC端首页已完成全量升级,将传统信息入口一举升级为任务中枢,为用户带来前所未有的智能搜索体验,进一步巩固了其在国内AI搜索行业的领先地位。 此次升级后的百度搜索PC端首页亮点纷呈。新增的“超级智能双行框”成为一大核心亮点,它支持用户一键进行深度搜索,无论是面对复杂的专业问题,还是多维度信息需求,都能快速给出精准且全面的解答

  • 刚预售就进抖音搜索TOP5!统帅热水器凭什么抓住年轻人的心?

    Leader统帅小音浪F7热水器精准把握年轻人需求,通过智能交互功能解决洗澡痛点:1)搭载超10万条指令语音库,支持99%准确率的语音控制,实现"动口不动手"的便捷操作;2)首创小白瓶净肤科技,99.3%除氯率+99.5%阻垢率,提升沐浴健康体验;3)双胆独立加热系统+780L大容量,兼顾加热效率与用水需求;4)310mm超薄机身适配小户型浴室。产品预售首日即冲上抖音热水器类目搜索TOP5,用户主动搜索超4.5万次,印证了"情绪价值+硬核性能"的创新方向正引领行业变革。

  • 苹果正在招聘团队:自研AI搜索平台

    彭博社记者马克古尔曼(Mark Gurman)报道,苹果正在组建一支新团队,开发一款类似ChatGPT的AI问答引擎,以应对快速变化的搜索与人工智能市场。 去年,苹果推出了自家的人工智能平台Apple Intelligence,并与OpenAI合作,将ChatGPT集成到Siri中,让用户能够通过Siri调用ChatGPT获取世界知识。 当时,苹果高层明确表示不会自研聊天机器人,称消费者兴趣有限,并坚称苹果在AI领域并未�

  • 从“同质化”到“价值创造”,LED行业迎来转型关键点

    LED封装行业在成本高压与政策东风交织下掀起自救式涨价潮。2025年8月木林森率先调价,东山精密、晶台光电等企业跟进,形成近十年规模最大、节奏最密集的涨价。行业长期陷于低价竞争恶性循环,政策层面新《反不正当竞争法》禁止低于成本倾销,推动行业从价格战转向价值竞争。头部企业凭借供应链和技术优势加速整合,中小企业面临生存压力。此次涨价是成本压力下的短期反弹,也是行业告别内卷、转向高质量发展的关键信号。

  • 多元活动传递正能量,中融人寿用实际行动诠释爱与责任

    2025年7月,中融人寿积极响应中国保险行业协会"7.8全国保险公众宣传日"活动,围绕"爱和责任"主题开展系列宣传。公司通过组织参观党史展览馆、健步走等红色教育活动强化使命担当;升级适老服务,设立"温暖驿站"为户外工作者提供便利;构建多层次宣传网络,开展"保险五进入"活动普及金融知识。这些举措既弘扬了红色精神,也彰显了保险行业的社会责任,用实际行动诠释"保险让生活更美好"的理念,助力提升全民金融素养与风险防范意识。

  • 中国茶快消化迎来关键载体:小罐茶焖泡系列即将上市

    中国茶产业正经历结构性变革,传统泡茶方式难以适应现代快节奏生活。新兴的"焖泡"茶饮方式成为介于传统冲泡与即饮茶之间的"第三极",小罐茶率先布局该领域,通过"茶品×茶具"一体化生态实现从产品到生活方式的跨越。其创新包括:获得红点设计奖的专用焖泡杯、针对年轻群体的模块化轻资产门店体系,以及标准化拼配工艺确保品质稳定。这种模式重构了茶产业底层逻辑,将茶还原为日常生活方式。小罐茶的实践证明传统文化可通过系统性创新融入现代生活肌理。未来中国茶将突破单一文化输出维度,以更开放姿态走向全球舞台。

  • 邦盛科技中标中国电信浙江分公司高性能流式计算引擎平台

    邦盛科技中标中国电信浙江分公司大数据基础能力升级项目,将建设高性能流式计算引擎平台。该项目通过实时处理通信流式大数据,提升浙江电信实时计算决策能力,构建基于现有基础设施的实时指标计算技术体系。项目采用邦盛自主研发的"流立方"时序大数据实时智能处理平台,支持每秒300万笔数据处理,平均延迟低于1毫秒,性能指标国际领先。平台将应用于电信网络诈骗识别预警,通过分析风险网站的时序访问行为,实现秒级指标计算和分钟级预警输出,赋能公安部门更精准高效地开展反诈工作。该平台还将支撑浙江电信各业务场景在时效性、精准性和分析能力等方面的提升,助力数字化转型。

  • 东融助贷董事长胡玉建一行视察泰州、扬州及镇江分公司

    2025年8月13日至14日,东融董事长胡玉建携第一、第三大区总经理任远、胡成尚一行赴泰州、扬州、镇江分公司开展视察指导工作。此行深入了解分公司经营情况,提振团队信心,明确发展方向,并围绕集团战略目标部署下一阶段重点工作。胡玉建分别对三家公司提出具体要求:泰州要坚守合规底线冲刺更高业绩;扬州需提升专业能力力争业绩跨越;镇江要锚定“双标杆”目标持续提升服务品质与市占率。此次视察为三地分公司注入强劲动力,助力东融高质量发展。

今日大家都在搜的词: