首页 > 业界 > 关键词  > 正文

Nucleus AI发布22亿参数大模型,致力农业领域的AI转型

2023-10-07 16:57 · 稿源:站长之家

文章概要:

1. 加利福尼亚初创公司Nucleus AI发布了22B参数的大规模语言模型,计划用于农业领域的AI转型。

2. 该模型可在开源和商业许可下使用,性能优越,可用于不同生成任务。

3. 公司的远景是构建智能农业操作系统,以优化供需关系,解决农业领域的挑战。

站长之家(ChinaZ.com) 10月7日 消息:加利福尼亚的初创公司Nucleus AI,汇聚了来自亚马逊和三星研究的人才,近日以一款强大的22亿参数大规模语言模型(LLM)正式亮相。这个模型可在开源MIT许可和商业许可下使用,它具有通用性,位于13B和34B模型之间,可以进行不同生成任务和产品的微调。Nucleus表示,这一模型在性能上胜过了相似规模的其他模型,最终将有助于实现公司将AI用于改变农业的目标。

Nucleus AI的首席执行官Gnandeep Moturi表示:“我们首先推出了我们的220亿模型,这是一个变换器模型。然后,大约在两周内,我们将发布我们的最新RetNet模型,这将在成本和推断速度方面带来显著的好处。”

耕地 收割机 农业 农场 (2)

图源备注:图片由AI生成,图片授权服务商Midjourney

Nucleus开始在大约三个半月前对22B模型进行训练,之后收到了一位早期投资者提供的计算资源。公司利用现有研究和开源社区的资源,对这个LLM模型进行了预训练,上下文长度为2048个标记,最终对它进行了万亿级的数据训练,包括从网络、维基百科、Stack Exchange、arXiv和代码中获取的大规模去重和清理信息。这为模型提供了丰富的知识库,涵盖了从一般信息到学术研究和编程见解的内容。

接下来,Nucleus计划发布更多版本的22B模型,它们分别在3500亿和7000亿标记的数据上进行了训练,还有两个RetNet模型,参数分别为30亿和110亿,它们在更大的上下文长度(4096个标记)上进行了预训练。这些较小规模的模型将融合了循环神经网络(RNN)和变换器神经网络架构的优点,将在速度和成本方面实现巨大的提升。在内部实验中,这些模型被发现要快15倍,仅需相似变换器模型通常要求的四分之一GPU内存。

然而,与其他LLM公司OpenAI、Anthropic和Cohere不同,Nucleus AI并没有将其模型仅限于企业应用。公司的远景是利用AI构建一个智能农业操作系统,旨在优化供需关系并减少农民面临的不确定性。Moturi解释道:“我们有一个类似市场的想法,需求和供应将被高度优化,就像Uber为出租车司机所做的那样。”这一举措将有助于解决农民面临的多个挑战,从气候变化和知识不足到供应的优化和分销的维护。

总的来说,Nucleus AI计划在农业领域推出创新性的解决方案,而不仅仅是构建对话机器人。尽管有挑战,但他们有信心通过在开源社区的贡献,将语言模型作为市场的核心,实现他们的愿景。有关面向农业的智能操作系统和RetNet模型的更多细节将在本月晚些时候公布。VentureBeat的使命是成为技术决策者获取有关变革性企业技术的知识和进行交易的数字城镇广场。

举报

  • 相关推荐
  • WAIC:卓世科技荣膺2025中国AI大模型企业商业落地TOP20

    2025世界人工智能大会(WAIC2025)在上海圆满落幕。卓世科技携"璇玑玉衡"大模型家族及全链路AI解决方案亮相,展示其在智慧工业、健康养老、文教传媒、政企服务等领域的标杆成果。会上发布《2025中国AI商业落地应用研究报告》及大模型TOP20榜单,卓世科技凭借垂直行业大模型的深度落地能力入选。其创新的"行业大模型+场景Agent+可持续运营"三位一体模式,为AI普惠提供了可复制的中国方案。卓世科技还首次全景展示基于MOE架构的"璇玑玉衡"大模型矩阵,实现从通用大模型到行业专属模型的精准跃迁,并带来全栈产品矩阵,打通大模型落地"最后一公里"。

  • AI模型怎么计费?大模型费用计算器助你精准预算,告别复杂参数困扰

    随着AI大模型普及应用,企业开发者面临复杂的计费挑战:主流模型采用Token计费,但不同模型Token换算差异大(如1Token=1.8汉字或1汉字),输入输出Token分开计价且输出更贵,隐藏成本包括上下文累积、重复调用等。定价模式多样(按量/包月),模型间价差显著(如DeepSeek V3成本仅为GLM-4Plus的1/3)。专业工具AIbase费用计算器(https://model.aibase.com/zh/calculator)可精准预估成本,覆盖GPT-4、文心一言等主流模型,智能处理Token换算和隐藏成本,提供多模型对比分析。实际案例显示,处理10万次咨询时文心一言成本(800元)显著低于GPT-4(2000+元)。未来趋势包括价格战推动成本下降、计费模式多元化(任务分级/套餐组合),建议企业建立成本监控体系,通过场景化分析和动态模型调整实现性价比最优。AI时代,专业计费工具将成为精准控制成本的关键。

  • 男子编造2岁女儿被抱走遭处罚:为博关注 由AI大模型生成

    近日,一则细节详尽的“2岁女儿王喵喵被抱走”的寻人启事在网络上疯狂传播,引发超百万次点击与大量转发,众多网友纷纷加入转发助力寻找的行列。 启事中描述走失者王喵喵为2岁女性,眼睛大大的,笑时会露出两颗小虎牙,在嘉兴市南湖区新丰镇乌桥超市被一大妈抱走,还附上了“父亲”与“母亲”的联系电话,字里行间满是焦灼,让人感觉是心急如焚的家长发出的求�

  • 2025年国内AI大模型哪家强?上AI大模型选型对比工具,用数据说话!

    文章分析了国内AI大模型市场竞争格局,指出百度、阿里、腾讯、字节等科技巨头与初创公司纷纷布局,呈现繁荣景象。针对用户选型难题,提出需综合考虑参数规模、场景适配、成本效益等关键因素,并介绍了AIbase推出的AI大模型选型对比工具。该工具汇集主流模型最新数据,支持多维度能力对比和场景化筛选,帮助用户快速定位最适合自身需求的模型。最后强调没有"最强"的通用模型,只有最匹配特定场景的解决方案。

  • AI 大模型选型指南:如何在众多模型中找到最适合你的那一个?

    本文探讨了如何从众多AI大模型中选择最适合自身需求的模型。文章提出应从四个核心维度进行评估:1)核心能力对比,包括通用任务表现和特定领域专长;2)成本与效率,考量API调用成本和响应速度;3)本地化与数据安全,满足合规要求;4)生态与社区支持,关注开发者活跃度和文档完善度。为解决模型对比难题,推荐使用专业平台如AIbase模型广场,可一站式对比主流模型的多维参数和评测数据。通过系统化评估,开发者能更高效地选择契合业务需求的AI模型。

  • 全球 AI 大模型排行榜 2025:GLM‑4.5 vs Qwen3‑235B‑A22B 深度对比

    2025年AI大模型技术进入竞争白热化阶段,中国厂商智谱AI与阿里通义在全球舞台持续发力。GLM-4.5系列和Qwen3系列成为最具代表性的开源模型:GLM-4.5采用MoE架构,综合性能全球第三,在编码任务中胜率超80%,工具调用成功率90.6%;Qwen3-235B采用动态专家路由机制,在长文本处理和中英文任务表现突出。文章通过架构、参数规模、基准测试等维度对比分析,推荐开发者使用AIbase模型广场一站式掌握全球大模型动态。最终结论:追求全面性能选GLM-4.5-X,注重部署效率选Qwen3-235B,轻量场景选Qwen332B。

  • 2025暑期档总票房破75亿 观影人次破2亿 你看了几部

    2025年暑期档电影市场热度爆棚,截至8月6日19时19分,暑期档(6月-8月)全国总票房已达75.29亿。 与此同时,总出票量突破2.00亿张,场次超2815.00万,平均票价37.7元,一系列亮眼数据,彰显暑期档电影市场的强劲活力。 票房排名中,《南京照相馆》表现突出,7月25日上映后,档期票房高达181401.56万,吸引5120.6万人次观影,场均人次21.4,票房占比24.1% ,成为暑期档票房领跑者”

  • AI大模型那么多,该如何科学对比选型?

    文章探讨了当前AI大模型选择的困境,指出随着国内外模型数量激增,用户面临选择难题。作者提出应从实际需求出发,考虑模型能力、成本、使用方式、中文支持等核心维度,避免只看参数规模或流行度的误区。特别推荐使用AIbase模型广场等对比工具,可快速比较多个模型的详细参数、调用方式和价格差异。文章以中文写作为例,对比了通义千问、月之暗面、文心一言和GPT-4�

  • AI大模型对比完全指南:如何选择最适合你的大模型?

    文章探讨了当前AI大模型市场众多选择带来的选择困难问题。面对GPT-4、Claude、文心一言等各具特色的模型,普通用户和企业难以科学评估和选择。文章提出了一套完整的评估体系,包括基础能力、技术性能、应用场景和商业考量四个维度,并建议采用标准化测试和实际场景验证相结合的方法。同时介绍了2025年主流AI模型的特点:GPT-4o在多模态交互领先,Claude3在编程和逻辑分析突出,Gemini2.5擅长长文本处理,国产DeepSeek则以高性价比见长。最后强调选择AI模型应基于具体需求,而非简单追求性能排名,建议通过专业对比平台和实际测试来验证。

  • 哪个大模型性价比最高?用这个 AI 大模型费用计算器轻松比价

    AI大模型快速发展,但不同厂商的定价规则差异大,导致选择困难。AIbase推出的AI大模型费用计算器(https://model.aibase.com/zh/calculator)能帮助开发者快速比较主流模型的调用成本。该工具覆盖GPT-4、Claude、文心一言等国内外热门模型,支持输入输出分开计费,实时更新官方定价,无需注册即可使用。用户只需输入文本,系统自动拆分token数并精准计算费用,结果清晰直观可排序。建议根据场景需求选择模型:平衡成本与性能可选GPT-4o、DeepSeek-V2;高精度需求选GPT-4 Turbo;中文场景优选国产模型。使用前通过计算器模拟成本,可避免项目超支风险。

热文