首页 > 业界 > 关键词  > 正文

Nucleus AI发布22亿参数大模型,致力农业领域的AI转型

2023-10-07 16:57 · 稿源:站长之家

文章概要:

1. 加利福尼亚初创公司Nucleus AI发布了22B参数的大规模语言模型,计划用于农业领域的AI转型。

2. 该模型可在开源和商业许可下使用,性能优越,可用于不同生成任务。

3. 公司的远景是构建智能农业操作系统,以优化供需关系,解决农业领域的挑战。

站长之家(ChinaZ.com) 10月7日 消息:加利福尼亚的初创公司Nucleus AI,汇聚了来自亚马逊和三星研究的人才,近日以一款强大的22亿参数大规模语言模型(LLM)正式亮相。这个模型可在开源MIT许可和商业许可下使用,它具有通用性,位于13B和34B模型之间,可以进行不同生成任务和产品的微调。Nucleus表示,这一模型在性能上胜过了相似规模的其他模型,最终将有助于实现公司将AI用于改变农业的目标。

Nucleus AI的首席执行官Gnandeep Moturi表示:“我们首先推出了我们的220亿模型,这是一个变换器模型。然后,大约在两周内,我们将发布我们的最新RetNet模型,这将在成本和推断速度方面带来显著的好处。”

耕地 收割机 农业 农场 (2)

图源备注:图片由AI生成,图片授权服务商Midjourney

Nucleus开始在大约三个半月前对22B模型进行训练,之后收到了一位早期投资者提供的计算资源。公司利用现有研究和开源社区的资源,对这个LLM模型进行了预训练,上下文长度为2048个标记,最终对它进行了万亿级的数据训练,包括从网络、维基百科、Stack Exchange、arXiv和代码中获取的大规模去重和清理信息。这为模型提供了丰富的知识库,涵盖了从一般信息到学术研究和编程见解的内容。

接下来,Nucleus计划发布更多版本的22B模型,它们分别在3500亿和7000亿标记的数据上进行了训练,还有两个RetNet模型,参数分别为30亿和110亿,它们在更大的上下文长度(4096个标记)上进行了预训练。这些较小规模的模型将融合了循环神经网络(RNN)和变换器神经网络架构的优点,将在速度和成本方面实现巨大的提升。在内部实验中,这些模型被发现要快15倍,仅需相似变换器模型通常要求的四分之一GPU内存。

然而,与其他LLM公司OpenAI、Anthropic和Cohere不同,Nucleus AI并没有将其模型仅限于企业应用。公司的远景是利用AI构建一个智能农业操作系统,旨在优化供需关系并减少农民面临的不确定性。Moturi解释道:“我们有一个类似市场的想法,需求和供应将被高度优化,就像Uber为出租车司机所做的那样。”这一举措将有助于解决农民面临的多个挑战,从气候变化和知识不足到供应的优化和分销的维护。

总的来说,Nucleus AI计划在农业领域推出创新性的解决方案,而不仅仅是构建对话机器人。尽管有挑战,但他们有信心通过在开源社区的贡献,将语言模型作为市场的核心,实现他们的愿景。有关面向农业的智能操作系统和RetNet模型的更多细节将在本月晚些时候公布。VentureBeat的使命是成为技术决策者获取有关变革性企业技术的知识和进行交易的数字城镇广场。

举报

  • 相关推荐
  • 九四智能亮相大阪,AI大模型驱动全球企业实现智能化转型

    2025年5月28-29日,九四智能(94AI)将携自主研发的"大模型联络中心"解决方案亮相大阪"2025呼叫中心CRM演示和会议"。该方案通过AI Agent技术实现从用户触达、需求挖掘到服务闭环的全流程自动化,助力企业重构客户服务与运营效率。作为智能语音领域领军企业,九四智能已在金融、电商、保险等行业积累创新实践,其解决方案支持多语种与文化适配,满足GDPR等全球合规要求。会议重点探讨了数字化转型背景下AI与CRM系统的深度融合,展示了AI在跨境场景中的语言、文化及合规优势。未来,九四智能将持续推动全球企业智能化转型。

  • 一场文心大模型的「AI马拉松」

    对于百度而言,既要保持长期主义的战略定力,也要在技术路径上灵活应变,这种「变与不变」的平衡或许正是其在这轮科技革命中的制胜之道。 2025年,模型能力的重要性依然无需多言。 从预训练的角度来看,虽然连 OpenAI 前首席科学家 Ilya Sutskever 都说,预训练数据即将用尽,但海量的图像、视频等多模态数据资源依然有待挖掘。 从后训练的角度来看,强化学习新范式正�

  • 苹果开放 AI 模型……计划于下个月在 WWDC 上发布

    尽管“Apple Intelligence”的首次亮相反响平平,但通过向开发者开放模型,苹果希望激发更多创新使用场景,提升平台的吸引力……

  • 大模型都能冲清北了?首个AI高考总分评测结果出炉

    7家国产大模型参加2025年辽宁高考模拟测试,结果显示:腾讯元宝在文科考试中以667.5分夺冠,接近清北录取线;豆包、讯飞星火分别以655分和652分紧随其后,均达985高校水平。理科方面,豆包以635分领先,元宝和Kimi分别获得632.5分和629分。测试发现大模型在文科表现优于理科,尤其在语文作文和数学解题能力突出,元宝数学获得149分高分。但在理科综合科目存在短板,物理化学的解题过程和知识点推导不够完整,图像符号理解不足。相比去年,今年大模型整体能力显著提升,已从"文科一本、理科二本"水平进步到冲击顶尖高校的水平,展现了国产AI的快速发展。

  • 2025年高考数学新一卷上热搜:6个AI大模型宣布挑战 谁更强?

    近日,随着高考的落幕,一场别样的“高考”也在各大AI大模型之间展开。此次测试邀请了多家知名科技公司的大模型,参与2025年数学新课标Ⅰ卷中的14道客观题测试,以此检验它们在逻辑推理和数学能力上的表现。测试题目包括8道单选题、3道多选题和3道填空题,满分73分,测试过程严格遵循高考判分原则。 测试结果显示,字节跳动的豆包和腾讯的元宝(T1)以68分的总成绩�

  • AI日报:腾讯混元3D 2.1大模型开源;字节跳动AI Lab负责人李航卸任;OpenAI Codex 全新升级

    本文介绍了AI领域最新动态:1)腾讯开源混元3D2.1大模型,提升3D生成质量;2)OpenAI Codex升级,优化代码生成功能;3)字节跳动AI Lab负责人李航卸任;4)微软发布700个AI应用案例;5)微软推出Code Researcher工具,解决58%系统崩溃问题;6)Observer AI实现屏幕操作自动化;7)Genspark发布AI浏览器;8)麻省理工用AI技术3.5小时修复15世纪名画;9)蚂蚁集团推出开源多模态GPT-4o模型Ming-Omni;10)MagicTryOn视频换衣框架;11)字节跳动发布实时互动AI视频生成模型Seaweed APT2;12)ChatGPT搜索功能升级;13)字节跳动与老凤祥合作开发AI智能眼镜。

  • 评测界鼻祖王自如宣布在AI领域重新创业 直言选AI是来钱快

    今日,王自如B站账号复更宣布回归,并改名为王自如AI,以AI测评UP主身份二次创业。 王自如在视频中表示:未来我想做的第一件事是做AI的内容创业,坦白来讲,因为这件事确实来钱快、资源整合的也快。” 王自如称,会选择高度聚焦AI应用方向,比如跟消费电子、产业、服务的结合,为第二件事做准备。

  • AI大模型客服赋能电商企业,轻松应对618流量高峰

    618大促期间,电商客服系统面临三大挑战:咨询量暴增300%、多渠道服务协同难、服务质量保障压力大。智能联络中心通过五大核心能力应对:1)AI智能分流处理80%常见咨询;2)语音识别+情感分析实现多模态交互;3)人机协同提升座席效率300%;4)全渠道数据整合实现服务无缝衔接;5)弹性云架构支持每秒10万级并发。以米糠云为代表的解决方案已帮助电商企业实现客服响应速度提升5倍,人力成本降低40%,客户满意度达98%,在物流、医疗等多行业落地验证。AI大模型的应用使企业在流量高峰中保持服务稳定性与用户体验的平衡。

  • AI日报:豆包大模型1.6发布;OpenAI推o3-pro模型、o3价格暴降80%;Figma官方MCP重磅上线

    【AI日报】今日AI领域重要动态:1)火山引擎发布豆包大模型1.6和视频生成模型Seedance1.0pro,性能显著提升;2)OpenAI推出o3-pro模型,专注可靠性但响应较慢;3)Figma推出Dev Mode MCP服务,实现设计到代码一键转换;4)Krea AI发布图像生成模型Krea1,解决传统AI绘图问题;5)火山引擎豆包日调用量突破16.4万亿次;6)法国Mistral发布推理模型Magistral;7)苹果系统整合ChatGPT图像生成功能;8)OpenAI大幅下调o3价格80%并推出o3-pro;9)Hugging Face开源榜单显示中国团队Qwen与DeepSeek进入全球前15;10)阿里开源MaskSearch框架,提升AI解决复杂问题能力。