首页 > 传媒 > 关键词  > 人工智能最新资讯  > 正文

加速原生创新,智谱携手昇腾、昇思打造自主创新原生模型

2024-08-21 16:17 · 稿源: 站长之家用户

2024年8月19日,北京人工智能生态大会在中关村国家自主创新示范区会议中心颐和厅成功召开。智谱CEO张鹏作专题分享,简要介绍了昇腾对自主创新的智谱大模型的助力,以及正在打造的基于昇腾的第四代代码模型CodeGeeX4和多模态模型CogVLM2-video,华为昇腾计算业务副总裁刘鑫介绍昇腾原生进展。

智谱代码生成大模型CodeGeeX4的新版本基于昇腾AI与昇思AI框架训练,依托昇腾与昇思的多维混合分布式并行技术等软硬件能力等,将大幅提升模型开发、训练的效率及模型精度。

智谱CEO 张鹏

华为昇腾计算业务副总裁 刘鑫

模型能力

1.代码生成大模型CodeGeeX4

第四代代码模型CodeGeeX4堪称代码生成大模型的“六边形战士”,已经发布的CodeGeeX4-ALL-9B 仅用百亿级参数实现模型精度超越业界主流产品。在NaturalCodebench等测试基准上,相对于更大的模型实现了性能反超。

CodeGeeX4单一模型实现编程开发全流程覆盖,包括需求设计、前端开发、后端开发、数据处理等场景,支持代码补全和生成、代码问答、代码解释器、工具调用、联网搜索、项目级代码问答等全面能力。模型长序列达128K,支持中文、英文、俄语、法语、西班牙语等20+自然语言和300+编程语言。同时,在模型推理可实现单卡部署,较低24GB显存即可进行量化推理,用户可在本地私有化部署,保护企业代码安全。

2.多模态大模型CogVLM2-video(视频生成文本)

多模态大模型CogVLM2-video实现视频生成文本能力,支持2K序列长度、224×224分辨率的视频理解以及中英文回答等功能。测试实践显示,CogVLM2-video在多个视频问答任务上达到了state-of-the-art SOTA模型)的性能,并能够实现一分钟内的视频理解,在几个主流性能测试数据集(MVBench, VideoChatGPT-Bench and Zero-shot VideoQA datasets)中,CogVLM2-video也表现不俗,展现出全面竞争力,同时在多类主要指标上完成对其他模型的领先。

基于昇腾与昇思的新版本CodeGeeX4

CodeGeeX4在训练过程中,调用昇腾原生的融合算子,利用昇思MindSpore AI框架的提供的多维混合分布式并行能力,通过对流水交织并行、tensor模型并行的优化,解决内存瓶颈、降低计算空泡、提升通信效率,实现“计算、网络、存储”协同优化,对比同等规模参数的模型,训练效率20%提升,加速模型的迭代创新。

另外,该模型也采用MindSpore2.3版本原创的多级编译技术,开启O1编译选项增加自动算子融合优化,以接近动态图的启动时间获取了图模式下接近理论值的内存复用率,进而降低重计算比例,相对动态图获得15%的性能收益。

未来,智谱将与昇腾AI持续携手,打造更多领先的自主创新大模型,加速人工智能产业发展,助力中国千行百业的智能化转型,共同迈向智能新世界。


推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 为国产模型和国产芯片造“桥”:昇腾平台上的DeepSeek-OCR-2迁移实录

    文章讲述了使用智子芯元KernelCAT工具,将DeepSeek-OCR-2模型高效迁移至华为昇腾Atlas A2国产芯片的过程。传统迁移需人工处理代码依赖、环境配置和算子优化,耗时费力。而KernelCAT作为AI Agent,能自动分析代码、适配环境、生成补丁,并将通用计算逻辑替换为针对国产硬件的优化实现,最终将推理速度从15 tokens/s大幅提升至550.45 tokens/s,加速超35倍。这展现了未来开发范式:人类定义目标,AI自主解决路径,让开发者从底层适配的繁琐工作中解放出来。

  • 2025新质生产力示范案例发布 华为云CloudMatrix AI Infra荣获人工智能TOP案例

    AI正从参数比拼转向赋能实体经济的“下半场”,行业重心转向千行百业的规模化应用落地。华为云凭借基于CloudMatrix+AI Infra的智算云服务,成功入选“人工智能基础与产业融合”示范案例TOP5,彰显了中国式AI与产业融合发展新路径。华为云坚持深入产业,解决行业难题,通过“车-网-云”协同的AI无人驾驶全栈方案,赋能矿山、水泥等行业实现降本增效。未来,华为云将继续坚持“做难而正确的事”,推动AI真正深入行业场景,共同迈向新质生产力发展的下一程。

  • 字节跳动旗下火山引擎发布视频生成大模型Seedance2.0

    字节跳动旗下火山引擎近日发布的视频生成大模型Seedance2.0,凭借“导演级”创作能力引发全球AI圈震动。这款在1.5Pro版本基础上迭代升级的模型,不仅攻克了人物一致性、视听同步等长期困扰行业的难题,更通过自动生成专业镜头切换功能,被业内人士评价为“可能抢走专业导演饭碗”的突破性产品。

  • 字节跳动即梦AI视频生成模型Seedance2.0怎么用?Seedance 2.0在哪?

    字节跳动旗下即梦平台近日正式上线新一代AI视频生成模型Seedance2.0,凭借多模态参考、高效创作与后期编辑融合等核心突破,成为影视、广告、短视频创作领域的焦点。该模型支持同时上传12个参考文件(图片、视频、音频),可精准复刻运镜逻辑、动作细节与音乐氛围,生成15秒视频仅需约30积分,较前代速度提升超10倍,显著降低废片率。

  • Seedance 2.0模型怎么用?字节跳动Seedance 2.0入口在哪?

    字节跳动旗下即梦平台近日推出的新一代AI视频生成模型Seedance2.0,凭借多模态参考、生成与编辑融合等技术创新,迅速成为影视、广告及短视频创作领域的“现象级”工具。该模型支持同时上传图片、视频、音频等12类参考文件,可精准复刻运镜轨迹、动作细节与音乐氛围,生成15秒视频仅需约30积分,速度较前代提升超10倍,废片率大幅降低,被业内称为“AI视频创作的效率革

  • AI日报:OpenAI推出macOS版Codex应用;智谱发布0.9B轻量级GLM-OCR;火狐Firefox 148浏览器即将上线

    本期AI日报涵盖多项AI领域动态:Adobe Firefly为订阅用户提供无限AI生成支持;OpenAI推出macOS版Codex应用,整合智能体化开发逻辑;智谱发布轻量级GLM-OCR模型,性能突出且成本低;火狐浏览器引入AI控制面板,支持一键屏蔽AI功能;腾讯回应红包刷屏质疑,强调为无门槛福利;港股大模型概念股走强;百度、小米等联手加持国家具身智能平台,完成超7亿融资;AI在“人类终极考试”中表现不佳,揭示其能力或被高估。

  • 影视飓风Tim回应字节Seedance 2.0模型:能力太恐怖

    知名视频博主Tim深度评测字节跳动AI视频模型Seedance2.0,盛赞其视频生成精细度、运镜流畅性及音画匹配度,称其可能“改变视频行业”。但他在测试中发现“恐怖”细节:仅上传个人照片,系统便自动生成高度相似的声音并匹配语气;上传建筑正面照后,模型竟能生成建筑背面的运镜,仿佛“知道”背后景象。Seedance2.0采用双分支扩散变换器架构,能同时生成视频与音频,用户上传图片或提示即可在60秒内生成带原生音频的多镜头序列视频。

  • 大模型六小龙告别青春期

    ​不到一个月的时间,大模型六小龙中的五家都集中进行了新一轮的战略表态。 月之暗面今天发布了新模型Kimi2.5,其创始人杨植麟在2025年12月31日发布了一封全员信,公开公司完成新一轮5亿美元融资,并表示会让Kimi成为一个「与众不同」和「不被定义」的大语言模型。1月26日,阶跃星辰公布了超50亿B+轮融资,并宣布前旷视科技创始人印奇出任公司董事长,明确押注AI与智能�

  • AI日报:字节发布超强视频模型Seedance2.0;小红书秘密研发AI剪辑器OpenStoryline;神秘AI模型“Pony Alpha”曝光

    本期AI日报聚焦多领域进展:字节跳动发布视频生成模型Seedance2.0,显著降低视频制作门槛;小红书研发AI视频剪辑工具OpenStoryline,支持对话式编辑;千问APP推出免单卡功能,便利年货采购;顶级域名AI.com以7000万美元成交,刷新历史纪录;神秘模型Pony Alpha因高性能免费引发关注,身份存疑;OpenAI首款AI硬件“Dime”智能耳机曝光,预计2026年发布;苹果CarPlay将支持第三方语音助手,提升交互体验;阿里新一代开源模型Qwen3.5代码现身,或为原生视觉语言模型,即将发布。

  • 实时生成开放世界:新AI模型贴脸开大,游戏研发慌不慌?

    这两天,又有一款全新的AI模型出现了。 虽说如今AI改变各行各业的事情早就屡见不鲜,在游戏业,很多岗位也或多或少已经用上了AI技术,但最近发布的这款AI模型,它真不一样。 这款AI模型名叫PixVerse R1,按官方说法,PixVerse R1是全球首个真正意义上的「实时生成世界模型(Real-time World Model)」。

今日大家都在搜的词: