作为国内较早布局人工智能大模型的企业之一,上海岩芯数智近日正式发布国内首 个非Attention机制的通用自然语言大模型——Yan模型。这也是业内少有的非Transformer架构大模型,拥有相较于同等参数Transformer的 7 倍训练效率、 5 倍推理吞吐、 3 倍记忆能力,同时支持CPU无损运行、
......
111本文由站长之家用户投稿发布于站长之家平台,本平台仅提供信息索引服务。为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。
(推广)