首页 > 业界 > 关键词  > lg最新资讯  > 正文

微软和NVIDIA共同推出迄今为止训练的且的语言模型

2021-10-12 07:51 · 稿源: cnbeta

微软英伟达今天宣布了由DeepSpeed和Megatron驱动的Megatron-Turing自然语言生成模型(MT-NLG),这是迄今为止训练的最大和最强大的解码语言模型。这个模型包括5300亿个参数,与现有最大的模型GPT-3相比,参数数量是其3倍。

训练这样的大型模型涉及各种挑战,沿着所有的人工智能轴线进行了许多创新和突破。例如,通过紧密合作,英伟达和微软将最先进的GPU加速训练基础设施与尖端的分布式学习软件堆栈相融合,实现了前所未有的训练效率。

微软与NVIDIA建立了高质量的自然语言训练语料库,其中包含数千亿个标记,并共同开发了训练配方,以提高优化效率和稳定性。

您可以从这里了解更多:

https://www.microsoft.com/en-us/research/blog/using-deepspeed-and-megatron-to-train-megatron-turing-nlg-530b-the-worlds-largest-and-most-powerful-generative-language-model/

https://developer.nvidia.com/blog/using-deepspeed-and-megatron-to-train-megatron-turing-nlg-530b-the-worlds-largest-and-most-powerful-generative-language-model/

举报

  • 相关推荐
  • 深度系统deepin 23.1发布:NVIDIA显卡、Intel/AMD处理器集体升级

    快科技4月16日消息,deepin深度操作系统团队发布了deepin 23.1版本,主要解决基础组件更新后的安装效率问题,大幅提升新用户安装体验,同时集成多项功能优化与问题修复,进一步优化系统使用。本次版本重点改进:硬件兼容性与内核优化:集成Linux 6.6/6.12内核更新、NVIDIA显卡驱动升级、Intel/AMD CPU处理器微码更新,全面提升硬件支持与底层性能;核心功能增强:DDE新增智能镜像源管理、紧凑模式入口,全局搜索支持离线自然语言与AI处理能力;开发工具与跨平台支持:应用商店适配Debian/Ubuntu/Arch等子系统环境,支持快速启动;如意玲珑

  • 首个支持NVIDIA DLSS的Switch 2游戏确认:《赛博朋克2077》

    文章主要讨论了Digital Foundry发布的一份关于Nintendo Switch新版本的报告,特别提到了《赛博朋克2077》在Nintendo Switch 2版本上运行时的性能表现。CD Projekt Red对此进行了优化,使得在高分辨率模式下游戏可以稳定在30fps,而在720p模式下则能以40fps运行。此外,文章指出,理论上在高分辨率模式下游戏可以达到1080p,而720p模式下则能以30fps运行。文章还提到,VGC对用户反馈的分析表明,《赛博朋克2077》在Switch 2版本上运行时达到了30FPS的性能目标,但是由于性能限制,仍然存在一些问题。

  • 任天堂Switch 2芯片首次曝光!搭载NVIDIA Tegra239支持DLSS

    任天堂Switch 2核心芯片Tegra 239参数曝光:采用8核Arm Cortex-A78C架构,集成1536个CUDA核心的GPU融合了Ada Lovelace和Ampere架构,支持128位LPDDR5内存。原生支持DLSS技术,可实现4K/60FPS输出,性能较前代显著提升。芯片主频1.1-1.5GHz,功耗表现优化。延续任天堂与NVIDIA合作传统,但官方尚未公布完整参数。此前Switch采用Tegra X1芯片,新款性能提升明显,有望带来更好的游戏体验。

  • 视频生成模型Vidu Q1怎么用?Vidu Q1官网是什么?

    国产视频生成大模型Vidu Q1在性能、价格和功能上实现重大突破。该模型由生数科技推出,在VBench评测中超越Sora等国内外顶尖模型,支持1080p高清视频生成,每秒价格低至3毛钱。其首尾帧功能仅需两张图即可实现电影级运镜效果,支持多元风格生成和48kHz高采样率混音功能。Vidu Q1已深度赋能影视、广告、动漫等行业,大幅降低创作门槛。

  • 小米通报海信Vidda商业诋毁案 称海信Vidda构成商业诋毁

    5月13日,小米法务部就与聚好看科技(海信旗下Vidda品牌)商业诋毁纠纷案终审结果发布声明。法院终审维持一审判决,认定聚好看2021年11月发布的含"米有问题""米有屌丝"等谐音文案的海报构成对小米商业诋毁,要求其在Vidda官微置顶致歉7天并赔偿小米55万元。Vidda已于5月10日发布致歉声明承认文案存在误导性。该案为净化行业竞争环境提供了司法范例,法院在审理中重点审查了涉案文案的语义指向性、传播范围及实际损害后果。小米强调企业竞争应遵循商业道德和法律规范,任何通过诋毁对手获取市场优势的行为都将受到法律制裁。(140字)

  • “奥迪助手”来了!全新AUDI车型接入豆包大模型

    2025年4月24日上海车展期间,上汽奥迪发布全新A5L Sportback和首款量产车型E5 Sportback。同时推出与火山引擎合作开发的"奥迪助手"智能交互系统,基于豆包大模型实现自然对话体验。该系统将搭载于两款新车,并同步部署在车载端和手机APP端,支持跨设备对话记录同步。火山引擎为系统提供大模型技术支持,实现语音指令控制、车辆功能讲解等智能服务,并整合抖音、汽水音乐等内容生态。上汽奥迪表示,该合作将助力品牌打造更智能、个性化的产品矩阵。

  • REDMI Turbo 4 Pro定制6.83英寸1.5K大屏:REDMI迄今最强

    Redmi Turbo 4 Pro于4月24日晚发布,配备定制6.83英寸1.5K大屏,采用优雅大R角设计,内外曲率一致,边框仅1.5mm,底部收窄至1.9mm,号称Redmi最美正颜。屏幕使用小米M9同款发光材料,功耗降低7%,显示更亮更准,支持3840Hz高频PWM调光+DC调光,通过视觉健康友好度S认证。工艺上采用旗舰金属中框和CNC喷砂工艺,整机抗弯折能力达70kg,Redmi呼吁行业告别塑料边框。

  • 开源即支持!基于昇腾MindSpeed MM玩转InternVL3多模态理解最新模型

    多模态理解领域当前已成了各家AI大模型公司“军备竞赛”的关键点之一,国内外知名AI大模型公司都争相通过发布最先进的多模态大语言模型展现其在多模态理解领域的前沿能力。近期,上海AI实验室推出了其最新的多模态大语言模型InternVL3 系列,相比上一代InternVL2. 5 模型,该模型展现出卓越的多模态感知和推理能力,同时进一步扩展了其工具使用、GUI代理、工业图像分析等

  • 阿里千问3登顶全球最强开源模型 已在通义App上线

    阿里集团推出新一代开源AI模型"通义千问3"(Qwen3),包含8款不同规格的混合推理模型。旗舰型号Qwen3-235B采用混合专家架构,创下国产模型性能新纪录;Qwen3-32B则以部署成本低、运行稳定见长。该系列在逻辑推理、编程、翻译等专业领域表现卓越,用户可通过通义App和网页版体验。升级后的通义App整合问答对话、图像理解与生成等多项功能,持续强化代码生成、数学解题等专业场景应用能力,致力于打造实用性强的个人AI助手。

  • 首次实现图像思考 OpenAI重磅发布o3/o4-mini:史上最强、最智能模型

    快科技4月17日消息,今日,OpenAI新款AI模型o3、o4-mini重磅发布,这是OpenAI迄今最强、最智能的模型。据了解,OpenAI o3/o4-mini首次具备真正的视觉推理能力,看图识图已经是小菜一碟了,现在还会看图思考。OpenAI o3/o4-mini能同时处理文本、图像和音频,并且能作为Agent智能体自动调用网络搜索、图像生成、代码解析等工具以及深度思考模式。通过强化学习,OpenAI训练了o3/o4-mini如何�