首页 > 业界 > 关键词  > nGPT最新资讯  > 正文

英伟达nGPT重塑Transformer,AI训练速度暴增20倍!文本越长,加速越快

2024-10-21 08:39 · 稿源: 新智元公众号

【新智元导读】LLM训练速度还可以再飙升20倍!英伟达团队祭出全新架构归一化Transformer(nGPT),上下文越长,训练速度越快,还能维持原有精度。AI的未来,或许就此改写......最近,英伟达团队抛出的一枚重磅炸弹,提出了全新神经网络架构——归一化Transformer(nGPT),基于超球

......

本文由站长之家合作伙伴自媒体作者“新智元公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 用友发布企业服务大模型YonGPT

    7月27日,用友企业服务大模型YonGPT正式发布。YonGPT是用友商业创新平台-用友BIP的重要组成,能够底层适配业界主流的通用语言大模型,通过提供通用能力服务、领域服务及行业服务,实现业务运营、人机交互、知识生成及应用生成4个方面的企业智能化。基于YonGPT的智能大搜,提供“沉浸式”搜索新体验,加速企业知识的价值化服务,并洞察用户需求、实现搜推一体,让知识赋能业务和组织。

  • 科学家开发出BrainGPT:可将思想转化为文本

    澳大利亚悉尼科技大学科学家开发出一种便携式、非侵入性的人工智能读心”头戴设备BrainGPT,可将思想转化成文本。BrainGPT把脑电波信号分割成不同的单元,从中捕获特定的特征和模式。研究人员表示,这套系统将来有望把准确率做到接近90%,这将是与传统语言翻译,或语音识别程序相当的水平。

  • 用友BIP升级 发布首个企业服务大模型YonGPT

    用友BIP重磅升级,发布用友BIP3最新版,在领先技术、应用架构、创新服务及生态规模上,持续迭代,进化发展。新发布的业界首个企业服务大模型YonGPT。YonGPT覆盖企业财务、人力和业务,契合了企业基于数智技术实现业务与业务、业务与财务、业务与管理融合创新的时代需求,能够为企业带来智能化的业务运营、自然化的人机交互、智慧化的知识生成、语义化的应用生成。

  • 专为金融打造!开源语言模型FinGPT 提供机器人顾问服务

    一篇介绍开源人工智能模型FinGPT的论文引起了广泛关注。该模型是专门为金融领域开发的,旨在为金融研究和开发提供易于使用的工具,包括自动化数据管理和类似机器人顾问和算法交易等应用的潜力。RLHF技术支持:FinGPT采用强化学习从人类反馈中学习个性化偏好,为用户提供个性化的投资建议和智能投资工具。

  • 《银河文明IV:超新星》通过 AlienGPT 技术将 ChatGPT 集成到游戏中

    游戏行业已开始探索使用人工智能的途径。我们看到这一技术推动的新迭代,如银河文明+IV:超新星版将把+ChatGPT+集成到其游戏,让玩家可以通过+AI+创建知识、对话对话以及更多方面。EGS+客户可以以大幅折扣的价格从《银河文明+4》升级到《超新星》。

  • 港大&百度发布首个智慧城市大模型UrbanGPT,助力时空预测技术突破

    香港大学与百度联合发布了首个智慧城市大模型UrbanGPT,该模型在时空预测技术领域引发了重大突破。时空预测技术的重要性日益凸显,不仅关注交通和人流的流动涵盖了犯罪趋势等多个维度。该模型的泛化能力也为智慧城市的发展提供了有力支持。

  • 多模态运动语言模型MotionGPT 可将语言指令转换为3D人体运动

    MotionGPT是一款令人惊叹的技术创新,它统一了语言和运动,将语言指令转换为引人入胜的3D人体运动。这一模型的设计灵感源于即时学习,通过混合运动语言数据进行预训练,并通过基于提示的问答任务进行微调,使其具备卓越的性能。MotionGPT不仅是一种技术的突破,更是对人机交互的重大推动,将语言与运动巧妙地融合,开创了全新的应用前景。

  • MotionGPT官网体验入口 AI机器学习应用社区免费使用地址

    MotionGPT是一个基于HuggingFaceSpaces打造的开源机器学习应用社区。用户可以发现许多由社区成员开发的酷炫机器学习项目和应用。要获取更多详细信息并加入这个机器学习应用社区,请访问MotionGPT官方网站。

  • 有望改写AI未来!NVIDIA全新nGPT使训练速度暴增20倍

    NVIDIA的最新研究可能彻底改变AI的未来,其研究团队提出了一种名为归一化Transformer的新型神经网络架构。这一架构在超球面上进行表示学习,能够显著提升大型语言模型的训练速度,最高可达20倍,同时保持了模型的精度。这种方法不仅提高了训练速度增强了模型的稳定性。

  • 一开发者搞了款ChatGPT应用程序WinGPT,竟可在老古董Win3.1 设备运行

    有开发者异想天开,竟然为Windows3.1的个人电脑制作了一个ChatGPT应用程序WinGPT。(注:Windows3.1是微软于1992年4月6日发布的Windows3.x系列的基于MS-DOS的操作系统。”如果你也有一台闲置的Windows3.1机器,那么可以在dialup.net网站上下载适用于16位和32位版本的Windows的WinGPT二进制文件。

今日大家都在搜的词: