11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
阿里Qwen团队正式发布他们最新的研究成果QwQ-32B大语言模型。这是一款拥有320亿参数的模型,其性能可与具备6710亿参数的DeepSeek-R1媲美。QwQ-32B已在HuggingFace和ModelScope开源,大家也可通过QwenChat直接进行体验!
今日,努比亚和红魔游戏手机官方都宣布,旗下手机将接入DeepSeekR1。中兴通讯终端事业部总裁、努比亚技术有限公司总裁倪飞还透露,相比于友商简单快速的智能体方案”接入,努比亚采用更深度的方式,直接将DeepSeek内嵌至系统中,并且是6710亿参数量的全尺寸嵌入。因其基础模型的计算能力仅花费了560万美元美国公司在人工智能技术上花费了数亿或数十亿美元,颠覆市场,一度导致美国科技股大跌。
据中国电信”官微发文,中国电信人工智能研究院联合北京智源人工智能研究院发布全球首个单体稠密万亿参数语义模型Tele-FLM-1T,成为国内首批发布稠密万亿参数大模型的机构。面对大模型训练过程中算力消耗巨大的挑战,TeleAI与智源通过深度研发,结合模型生长和损失预测等关键技术,成功推出了Tele-FLM系列模型。TeleAI不仅在技术创新上不断突破积极通过开源方式推动大模型技术的普及和国产化进程。
据外媒theInformation报道,微软正准备推出一种新的、内部AI语言模型。新模型内部代号为MAI-1,由最近加入微软的梅斯塔法・苏莱曼负责,他是谷歌DeepMind的联合创始人,也是人工智能初创公司Inflection的前CEO。报道补充说,新模型并非来自Inflection,尽管它可能基于该初创公司的训练数据。
大数据公司Databricks最近发布了一款名为DBRX的MoE大模型,引发了开源社区的热议。DBRX在基准测试中击败了Grok-1、Mixtral等开源模型,成为了新的开源之王。根据Databricks公布的协议,基于DBRX打造的产品,如果月活超过7亿,就必须另行向Databricks提交申请。
3月28日,著名数据和AI平台Databricks在官网正式开源大模型——DBRX。DBRX是一个专家混合模型有1320亿参数,能生成文本/代码、数学推理等,有基础和微调两种模型。Databricks主要提数据智能分析服务,帮助企业、个人用户快速挖掘数据的商业价值。
马斯克旗下xAI宣布开源Grok-1。Grok-1基础模型基于大量文本数据训练,共有3140亿参数。该公司团队成员曾在DeepMind、OpenAI、谷歌研究院、微软研究院、特斯拉及多伦多大学供职,由埃隆・马斯克领导。
马斯克承诺的开源版大模型Grok终于来了!今天凌晨,马斯克旗下大模型公司xAI宣布正式开源3140亿参数的混合专家模型「Grok-1」,以及该模型的权重和网络架构。这也使得Grok-1成为当前参数量最大的开源大语言模型。鉴于马斯克对开源的积极态度,有些技术人员已经在期待后续版本的开源了。
苹果显然已经加大了对生成式人工智能的重视和投入。此前在2024苹果股东大会上,苹果CEO蒂姆・库克表示,今年将在GenAI领域实现重大进展。更多研究细节,可参考原论文。
苹果公司最新发布了一款名为MM1的大型多模态基础模型,拥有300亿参数,采用了MoE架构,并且超过一半的作者是华人。该模型在多模态领域具有重要意义,可能预示着苹果未来推出与此相关的产品。该研究的成果对于推动生成式人工智能领域的发展具有重要意义,值得业界密切关注。