首页 > 业界 > 关键词  > 正文

Nucleus AI发布22亿参数大模型,致力农业领域的AI转型

2023-10-07 16:57 · 稿源:站长之家

文章概要:

1. 加利福尼亚初创公司Nucleus AI发布了22B参数的大规模语言模型,计划用于农业领域的AI转型。

2. 该模型可在开源和商业许可下使用,性能优越,可用于不同生成任务。

3. 公司的远景是构建智能农业操作系统,以优化供需关系,解决农业领域的挑战。

站长之家(ChinaZ.com) 10月7日 消息:加利福尼亚的初创公司Nucleus AI,汇聚了来自亚马逊和三星研究的人才,近日以一款强大的22亿参数大规模语言模型(LLM)正式亮相。这个模型可在开源MIT许可和商业许可下使用,它具有通用性,位于13B和34B模型之间,可以进行不同生成任务和产品的微调。Nucleus表示,这一模型在性能上胜过了相似规模的其他模型,最终将有助于实现公司将AI用于改变农业的目标。

Nucleus AI的首席执行官Gnandeep Moturi表示:“我们首先推出了我们的220亿模型,这是一个变换器模型。然后,大约在两周内,我们将发布我们的最新RetNet模型,这将在成本和推断速度方面带来显著的好处。”

耕地 收割机 农业 农场 (2)

图源备注:图片由AI生成,图片授权服务商Midjourney

Nucleus开始在大约三个半月前对22B模型进行训练,之后收到了一位早期投资者提供的计算资源。公司利用现有研究和开源社区的资源,对这个LLM模型进行了预训练,上下文长度为2048个标记,最终对它进行了万亿级的数据训练,包括从网络、维基百科、Stack Exchange、arXiv和代码中获取的大规模去重和清理信息。这为模型提供了丰富的知识库,涵盖了从一般信息到学术研究和编程见解的内容。

接下来,Nucleus计划发布更多版本的22B模型,它们分别在3500亿和7000亿标记的数据上进行了训练,还有两个RetNet模型,参数分别为30亿和110亿,它们在更大的上下文长度(4096个标记)上进行了预训练。这些较小规模的模型将融合了循环神经网络(RNN)和变换器神经网络架构的优点,将在速度和成本方面实现巨大的提升。在内部实验中,这些模型被发现要快15倍,仅需相似变换器模型通常要求的四分之一GPU内存。

然而,与其他LLM公司OpenAI、Anthropic和Cohere不同,Nucleus AI并没有将其模型仅限于企业应用。公司的远景是利用AI构建一个智能农业操作系统,旨在优化供需关系并减少农民面临的不确定性。Moturi解释道:“我们有一个类似市场的想法,需求和供应将被高度优化,就像Uber为出租车司机所做的那样。”这一举措将有助于解决农民面临的多个挑战,从气候变化和知识不足到供应的优化和分销的维护。

总的来说,Nucleus AI计划在农业领域推出创新性的解决方案,而不仅仅是构建对话机器人。尽管有挑战,但他们有信心通过在开源社区的贡献,将语言模型作为市场的核心,实现他们的愿景。有关面向农业的智能操作系统和RetNet模型的更多细节将在本月晚些时候公布。VentureBeat的使命是成为技术决策者获取有关变革性企业技术的知识和进行交易的数字城镇广场。

举报

  • 相关推荐
  • 东南大学发布全国高校首个纪检监察大模型“清鉴”:AI 介入执纪执法的技术标准与应用边界

    “清鉴”大模型是由东南大学研发、专门面向纪检监察垂直领域的深度学习大语言模型。该模型整合海量党内法规、国家法律及实务判例,旨在为执纪执法工作提供权威政策解读、廉政风险分析及智能业务问答等技术支持。2026年4月21日正式亮相,标志着中国纪检监察工作从传统数字化办公向以“文工交叉”为核心的智能化治理阶段转型。模型采用私有化部署与检索增强生成(RAG)技术,确保输出有法可依,并覆盖全国31个省份的地方性规范文件,可识别不同行政区域的执纪差异。其核心应用场景包括政策解读、风险分析、廉政教育、学术支持与智能问答。模型作为辅助工具,需经人工审核定性与定期数据更新,以保障其严谨性与时效性。

  • 面壁智能,大模型“另类”生存法则

    面壁智能,是中国大模型行业中的“另类”。 在国内外大肆流行Scaling Law(规模定律),即奉行参数越大、数据越多、算力越强,模型能力就越强的时候。 面壁智能则反其道行之,遵循“知识密度”,即用更少的参数实现更强的能力;以及“密度法则”,即在有限算力下,持续提升模型能力密度。 一个是“大力出奇迹”,一个是“以小博大”,这注定一开始面壁就与主流的�

  • AI日报:Kimi K2.6模型发布;腾讯QClaw海外版上线;爱奇艺回应“签约AI演员”

    本文汇总了AI领域最新动态:月之暗面发布Kimi K2.6模型,性能对标国际顶尖;腾讯QClaw海外版上线,支持主流模型并引入Agent“领养”机制;OpenAI为Codex新增“数字记忆”功能,提升协作效率但存安全风险;爱奇艺回应“签约AI演员”争议;谷歌Chrome浏览器Gemini功能扩展至更多亚太地区;谷歌AI Studio向Pro/Ultra会员免费开放;天猫超市推出首个AI智能体“超喵1.0”;Miclaw实现多端互联升级,支持跨设备协同与语音远程控制。

  • 国产AI大模型GLM-5.1登顶开源第一:可独立编程8小时

    3月底智谱正式推出了GLM-5.1大模型,编程能力评分45.3分,号称比全球最强的Opus 4.6只低了2.6分。 前两天GLM-5.1大模型也正式开源,也深受开发者喜爱,现在最新的排名也来了全球权威AI评测平台LMArena(百万用户参与盲测)更新Code Arena专项榜单,GLM-5.1登顶全球开源模型第一,位列全球模型第三。 除了榜单表现优秀,根据智谱的说法,GLM-5.1不仅继承了上一代模型的开源SOTA编码能

  • 腾讯云发布 Token 防刷解决方案,精准狙击大模型黑产

    随着AI编程助手普及,开发者效率提升,但免费Token成为黑产套利目标。黑产通过批量注册、虚拟环境等手段薅取Token,用于倒卖或生成内容牟利。腾讯云天御Token防刷方案从入口验证到全链路风控,通过设备指纹识别批量注册和伪装行为,并对Token发放、流转、消耗全环节布控,确保补贴流向真实用户。该方案支持极简接入,规则秒级热更新,有效打击规模化黑产作业,保护企业营销预算与利润。

  • 热血十年・智启未来|陈开冉:筑牢数据护城河,打造垂类大模型

    4月18日,探迹科技在广州举办十周年庆典,创始人陈开冉发表演讲,指出AI大模型正从参数竞赛转向深度推理与垂直落地。汉数科技依托高质量数据集与AI OS、HanPaaS架构,为企业提供可规模化落地的数智化转型路径。他强调2025年是智能体应用爆发元年,AI Coding将重构软件开发逻辑。面对通用模型在企业场景的瓶颈,汉数科技通过深耕行业Know-How与高质量数据,打造差异化企业级AI解决方案,以技术沉淀引领产业变革。

  • 当健康产业换上“AI操作系统”:2026西普会发布年度主题,大模型进入垂直产业深水区

    从“通用大模型”到“产业智能体”,健康产业正在成为AI技术落地的最大试验场之一。4月9日,第十九届西普会主题正式发布——“走进AI时代:健康产业的范式革命与路径选择”,大会定于8月11日至16日在海南博鳌举行。对于AI科技圈的从业者而言,这个主题的价值不在于它提到了AI,而在于它释放了一个信号:健康产业正在将AI视为底层操作系统,而不是一个提效工具。 这意味

  • 改写语音交互行规,豆包大模型更稳了

    豆包大模型,又上新了。 2026年4月9日,原生全双工语音大模型Seeduplex正式发布,相比上一代半双工豆包端到端语音模型,新模型基于“边听边说”的全新框架设计,交互体验的自然感、顺畅度大幅提升,目前已在豆包App全量上线。 这意味着,前沿的全双工语音技术,第一次实现商业规模化落地。 而依托全双工语音技术,豆包的语音交互不再是机械式的一问一答,而是收放�

  • 去有风的地方!海尔即将在大理发布AI空调标杆新品

    文章探讨了现代家庭使用空调时面临的诸多困扰:自然风的舒适难以复制,空调直吹易致不适,家有老人孩子时更需谨慎调节,长时间使用导致空气干燥、电费高昂,中央空调噪音影响睡眠等。对此,海尔空调将于4月25日发布六大AI标杆新品,涵盖洗空气、舒适风、省电等功能,旨在系统性解决用户痛点,将自然舒适通过智慧科技带入寻常百姓家。这体现了海尔以用户为中心的科技生态实践。

  • 潮玩:消费领域的下一个万亿机会

    一张天猫年度IP影响力榜单的照片丢进小红书,评论区立刻变成各家粉丝的「颁奖典礼」。周可可的妈妈粉第一时间留言:「这是我们真金白银投出来的。」 「恋与深空」联名香水刚放出预告图,玩家们就排队许愿、互相提醒闹钟,BJD原创设计系列变身电器街上线一秒,数万件售罄。 大街上,挂着IP属性的毛绒去打卡主题店,甚至背着扎满谷子的「痛包」通勤,也不再是稀奇�

今日大家都在搜的词: