首页 > AI头条  > 正文

智谱AI开源端侧大语言和多模态模型GLM-Edge系列

2024-11-30 10:01 · 来源: AIbase基地

智谱科技近日宣布开源其端侧大语言和多模态模型GLM-Edge系列,这一举措标志着公司在端侧真实落地使用场景中的一次重要尝试。GLM-Edge系列由四种不同尺寸的模型组成,包括GLM-Edge-1.5B-Chat、GLM-Edge-4B-Chat、GLM-Edge-V-2B和GLM-Edge-V-5B,分别针对手机、车机等移动平台以及PC等桌面平台进行了优化。

智谱 AI

基于GLM-4系列的技术积累,智谱的研究团队对模型结构和尺寸进行了调整,以实现模型性能、实机推理效果和落地便利度之间的最佳平衡。通过与合作伙伴的深入合作和推理优化,GLM-Edge系列模型在一些端侧平台上展现出了卓越的运行速度。特别是在高通骁龙8Elite平台上,借助NPU算力和混合量化方案,1.5B对话模型和2B多模态模型能够实现每秒60tokens以上的解码速度,应用投机采样技术后,解码速度更是能达到每秒100tokens以上。

智谱开源的GLM-Edge系列模型不仅展示了公司在人工智能领域的技术实力,也为开发者和研究者提供了强大的工具和资源,以促进端侧AI应用的发展和创新。

GLM-Edge合集:

https://modelscope.cn/collections/GLM-Edge-ff0306563d2844

  • 相关推荐
  • AI日报:OpenAI重磅上线Sora;智谱AI免费多模态模型GLM-4V-Flash;腾讯云打造AI代码助手

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、OpenAI正式上线Sora,ChatGPTPro用户可无限生成、最长20秒OpenAI在"ship-mas"系列活动中发布了SoraTurbo视频生成AI,支持生成20秒1080p视频,用户可通过文本、图片或视频进行创作,具有多种风格和剪辑功能。See3D已开源,支持多种3D创作应用。

  • 超GPT-4o,1240亿参数!最强开源多模态模型 Pixtral Large

    法国著名开源大模型平台Mistral.ai,开源了超大多模态模型——PixtralLarge。PixtralLarge有1240亿参数,支持128K上下文,能理解文本、图表、图像等,也是Mistral.ai自家聊天助手leChat目前正在使用的视觉模型。LeChat提供了一个从模型到输出的完全集成平台,用户可以在一个平台上完成所有的多模态任务,无需在多个工具之间切换,简化了工作流程。

  • 北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超越闭源模型

    北大等出品,首个多模态版o1开源模型来了——代号LLaVA-o1,基于Llama-3.2-Vision模型打造,超越传统思维链提示,实现自主“慢思考”推理。在多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型。团队宣布LLaVA-o1的代码、预训练权重、数据集等即将全部开源。

  • AI日报:阿里云逆天大模型Qwen2.5-Turbo;ElevenLabs支持打造对话AI智能体;Mistral推最强开源多模态模型Pixtral Large

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、阿里云发布逆天大模型Qwen2.5-Turbo一口气读完十本小说,推理速度提升4.3倍!阿里云推出的Qwen2.5-Turbo大语言模型在上下文处理能力和推理速度上都取得了革命性的突破,令人期待其�

  • 不做Sora背后:百度的多模态路线是什么?

    当ChatGPT掀起国内“百模大战”,百度率先交卷文心一言。Sora再掀视频生成风潮,却传出李彦宏内部讲话“Sora无论多么火,百度都不去做”。大量的行业应用所产生的数据,又能为AGI的发展提供丰富的养分,形成良性循环,推动数据飞轮的高速运转,从加快我们迈向AGI的步伐。

  • 首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务

    【新智元导读】Meta最近开源了一个7B尺寸的SpiritLM的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换,不仅能处理基本的语音转文本和文本转语音任务能捕捉和再现语音中的情感和风格。在纯文本大模型取得进展的同时,其他模态数据,如语音与文本结合的语言模型也成为了一个热门的研究领域,但现有的模型要么在仅包含语音的数据上进行训练,要么是关注特定任务,如文本转语音、自动语音识别或翻译,在其他模态数据和任务上的泛化能力十分有限。研究人员还直接评估了模型对输入提示的处理能力,结果发现,无论是哪种提示,模型都能得到很高的评分,表明还有很大的空间来进一步提高模型在保持情感表达方面的能力,也意味着,智能体在理解和生成情感丰富的内容方面还有很大的潜力可以挖掘。

  • AI日报:科大讯飞星火多模态交互大模型上线;Anthropic发布提示词优化新功能;腾讯AI智能工作台ima上线Windows版

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、科大讯飞星火多模态交互大模型上线实现“语音、视觉、数字人交互”三合一科大讯飞最新推出的讯飞星火多模态交互大模型标志着其从单一语音交互技术拓展到音视频流实时多模态交互的新阶段。多家汽车制造商参与认购,推动Robotaxi技术合作与全球布局。

  • 亚马逊祭出地表最强全家桶,多模态Nova却败给Claude 3.5!

    【新智元导读】围剿英伟达,数十万颗自研二代芯片超算在建!亚马逊祭出地表最强全家桶,多模态Nova击败GPT-4o。亚马逊推出了号称最强大的多模态模型Nova系列。IDC在2023年12月发布的最新研究报告显示,英伟达当前在AI芯片市场中占据着约95%的主导地位。

  • 微软Edge Game Assist上线:自动显示游戏攻略、告别繁琐切换窗口

    微软宣布推出EdgeGameAssist预览版,这是一个专为PC游戏优化的微软Edge浏览器特殊版本,能够集成在Windows11系统的GameBar中。该工具可以自动识别玩家正在玩的游戏,并显示相关的提示和指导,大大简化了玩家在游戏中查找攻略的过程。EdgeGameAssist仅支持英文界面,已适配的游戏名单包括《博德之门3》、《暗黑破坏神IV》、《堡垒之夜》、《地狱之刃:塞娜的献祭》、《英雄联盟》

  • 智谱新清影:模型全面升级、4K、任意比例、自带音效

    11月8日,智谱推出新清影:10s时长、4k、60帧超高清画质、任意尺寸,自带音效,以及更好人体动作和物理世界模拟。3个月前,作为国内首个面向公众开放的视频生成产品,清影上线清言App,只需一段指令或图片,30秒就能生成AI视频。但基于智谱多模态的最新成果,实现这种一站式AI原生多模态工作流,这样的前景无疑是激动人心的。

今日大家都在搜的词: