11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
快科技9月9日消息,据媒体报道,针对近日网上谣传文心一言背后的通用大模型被放弃消息,文心一言市场部负责人张全文在朋友圈发文辟谣。张全文表示,所谓放弃通用大模型研发”纯属谣言!文心一言刚完成了功能全面升级。我们将持续加大在通用大模型领域的研发投入。百度公布的数据显示,文心一言大模型用户量已突破3亿,日调用次数达到5亿,行业基于文心一言大模型
阶跃星辰团队宣布推出了Step系列通用大模型,包括Step-1千亿参数语言大模型、Step-1V千亿参数多模态大模型,以及Step-2万亿参数MoE语言大模型的预览版。阶跃星辰成立于2023年4月,以“智能阶跃,十倍每一个人的可能”为使命。跃问是基于Step系列千亿参数模型研发成的个人效率助手冒泡鸭则是用Step系列千亿参数模型开发的AI开放世界,让用户可以探索故事,创造角色。
英伟达团队推出了全新的模型Nemotron-4,150亿参数,在8Ttoken上完成了训练。值得一提的是,Nemotron-4在英语、多语言和编码任务方面令人印象深刻。这种能力凸显了Nemotron-415B对广泛的自然语言的深刻理解。
英伟达最新推出的Nemotron-4语言模型引起广泛关注。这一通用大模型拥有150亿参数,经过在8Ttoken上的训练,在英语、多语言和编码任务中表现出色。Nemotron-4的推出标志着英伟达在通用大模型领域的一次重要突破,为单个A100或H100GPU上运行的最佳通用大模型设定了新标准。
作为国内较早布局人工智能大模型的企业之一,上海岩芯数智近日正式发布国内首个非Attention机制的通用自然语言大模型——Yan模型。这也是业内少有的非Transformer架构大模型,拥有相较于同等参数Transformer的7倍训练效率、5倍推理吞吐、3倍记忆能力,同时支持CPU无损运行、低幻觉表达、100%支持私有化应用。Yan架构可作为人工智能领域的基础设施,并以此建立AI领域的开发者生态,最终让任何人在任何设备上都能使用通用大模型,获取更加经济、便捷、安全的AI服务,推动构建普惠的人工智能未来。
自从2022年底openAI推出ChatGPT开始,大型语言模型的热度吸引了全世界的眼球,相关研究也取得了令人瞩目的进展。除了纯语言模型相关的技术研究以外,将视觉能力融入大语言模型的视觉语言模型也迅猛发展。06联系我们如果您对悠然多模态产业通用大模型感兴趣,请联系我们。
元象XVERSE宣布开源650亿参数高性能通用大模型XVERSE-65B,无条件免费商用。XVERSE-65B是由深圳元象科技开发的一种支持多语言的大型语言模型。训练框架:自主研发多项关键技术,包括高效算子、显存优化、并行调度策略、数据-计算-通信重叠、平台和框架协同等,让训练效率更高,模型稳定性强,在千卡集群上的峰值算力利用率位居业界前列。
元象宣布开源70亿参数通用大模型XVERSE-7B底座与对话版,这是一款全开源、免费可商用的模型。相比之前的XVERSE-13B,7B版本更小巧,可以在单张消费级显卡上运行,并且推理量化后最低只需6GB显存,大大降低了开发门槛和推理成本。●XVERSE-7B-Chat是底座模型经SFT指令精调后的中英文对话模型,大幅提升了理解和生成内容的准确度,也更符合人类的认知偏好。
9月20日,生数科技发布了自主研发的多模态通用大模型,并同时推出了两款应用产品:视觉创意设计平台PixWeaver和3D资产创建工具VoxCraft。生数科技的多模态通用大模型采用底层融合的思路,将Transformer架构引入扩散模型,实现文本、图像、3D、视频等多模态知识的融合。生数科技的大模型还面向游戏制作、影视制作、广告营销等多个行业提供服务能力,支持各类创意内容的生成。
数学通才「猛犸」模型给开源语言模型带来了「推理春天」,面对GPT-4都有一战之力!数学推理问题是语言模型绕不过的痛点,在各种黑科技的加持下,开源模型的推理性能依然不够看。滑铁卢大学、俄亥俄州立大学、香港科技大学、爱丁堡大学的研究人员联合开源了一个专为「通用数学问题」定制的大模型MAmmoTH和一个指令调优数据集MathInstruct.论文链接:https://arxiv.org/pdf/2309.05653