首页 > AI头条  > 正文

NASA与IBM合作开发INDUS大语言模型 用于高级科学研究

2024-06-26 11:04 · 来源: AIbase基地

NASA 的跨机构实施和先进概念团队(IMPACT)通过与私营、非联邦合作伙伴签署太空法案协议,共同开发 INDUS,这是一套面向地球科学、生物和物理科学、日球物理学、行星科学以及天体物理学等领域的大型语言模型(LLM),并使用来自多样化数据源的策划科学文献进行训练。

image.png

INDUS 包含两种类型的模型:编码器和句子转换器。编码器将自然语言文本转换为数字编码,可以由 LLM 处理。INDUS 编码器在包含天体物理学、行星科学、地球科学、日球物理学、生物科学和物理科学数据的60亿令牌语料库上进行了训练。IMPACT-IBM 合作团队开发的自定义分词器通过识别生物标志物和磷酸化等科学术语,改进了通用分词器。INDUS 中超过一半的5万个词汇是针对其培训所使用的特定科学领域而独有的。INDUS 编码器模型被用于对约2.68亿个文本对进行微调,其中包括标题 / 摘要和问题 / 答案。

通过为 INDUS 提供领域特定的词汇,IMPACT-IBM 团队在生物医学任务基准测试、科学问答基准测试和地球科学实体识别测试上,实现了比开放、非领域特定 LLM 更出色的表现。通过设计多样化的语言任务和检索增强生成,INDUS 能够处理研究人员的问题、检索相关文档并生成答案。对于延迟敏感的应用,该团队开发了更小、更快的编码器和句子转换器模型版本。

验证测试表明,INDUS 在回答 NASA 约400个问题的测试集时,能够从科学文献中检索出相关段落。IBM 研究员 Bishwaranjan Bhattacharjee 评论了整体方法,“我们通过不仅拥有自定义词汇,还拥有大量专门的训练编码器模型和良好的训练策略来实现了卓越的表现。对于更小、更快的版本,我们使用神经架构搜索来获取模型架构,并使用更大的模型监督进行知识蒸馏进行训练。”

划重点:

- 🚀NASA 与 IBM 合作开发 INDUS 大型语言模型,适用于地球科学、生物和物理科学、日球物理学、行星科学和天体物理学等领域。

- 🎓INDUS 包含编码器和句子转换器两种类型的模型,使用自定义分词器和60亿令牌语料库进行训练,并在约2.68亿个文本对上进行微调。

- 💡INDUS 通过领域特定的词汇和设计多样化的语言任务和检索增强生成,实现了比开放、非领域特定 LLM 更出色的表现,能够处理研究人员的问题、检索相关文档并生成答案。

  • 相关推荐
  • 科研驱动发展 iRest艾力斯特携手温州医科大深度产学研合作

    文章介绍了现代人因久坐和工作压力导致的身体疲劳问题,指出智能按摩椅能通过专业按摩手法缓解肌肉紧张、改善睡眠质量。重点介绍了iRest艾力斯特按摩椅采用专利技术和AI智能系统,与多所高校及科研机构合作开展医学研究,在运动恢复、睡眠障碍改善等方面取得显著效果。该品牌通过与刘震院士等专家合作,持续优化产品功能,致力于为消费者提供更专业的健康解决方案。

  • OpenAI控诉微软反竞争行为 科技巨头合作现裂痕

    微软与OpenAI这对曾被视作天作之合的AI黄金搭档,如今关系紧张到可能重塑整个人工智能产业格局……

  • 寒武纪:携手合作伙伴 共同繁荣合作生态

    东方证券研报显示,寒武纪2024年业绩表现亮眼:全年营收11.74亿元,同比增长65.56%,其中云端产品线收入占比高达99.30%,同比暴增1187.78%。公司实现连续两个季度盈利,2025年一季度营收同比激增4230.22%至11.11亿元。作为专注AI芯片研发的企业,寒武纪通过产业生态建设和技术开源,持续推动半导体领域创新,产品覆盖物联网、金融、医疗等多个场景。2024年公司深化合作伙伴生态共建,完成多项产品兼容适配认证,并通过开发者社区运营和技术开源支持AI生态发展。

  • 雷军祝贺高通成立四十周年 称高通始终是坚定的合作伙伴

    5月21日,美国高通公司与小米公司庆祝合作15周年,并签署了多年期合作协议。雷军通过视频祝贺高通成立40周年,盛赞高通在移动技术创新领域的领导地位。双方合作从小米首款手机延伸至智能汽车、穿戴设备等领域,高通技术为小米产品提供了强大支持。根据协议,小米旗舰手机将继续搭载骁龙8系移动平台,覆盖多代产品并全球销售,预计出货量逐年增长。小米还将成为首批采用下一代骁龙8系旗舰平台的厂商之一。双方表示将在智能手机、汽车、可穿戴设备等多个领域深化合作,共同推动行业发展。

  • 如何用DeepSeek快速起草高质量商务合作邮件

    本文介绍如何利用DeepSeek AI快速生成专业商务合作邀约邮件。传统邮件撰写耗时费力,而通过该工具只需四步:1)登录官网输入指令;2)提供合作对象、内容等关键信息;3)AI自动生成结构清晰、措辞专业的邮件草稿;4)复制到邮箱发送或下载存档。该工具能显著提升商务沟通效率,特别适合需要频繁进行业务往来的职场人士,支持个性化调整并保留专业度,是现代化办公的高效解决方案。(139字)

  • WEEX与AiCoin达成战略合作

    WEEX交易所与AiCoin达成战略合作,将全面接入现货和合约市场行情数据,提升交易透明度。此次合作将增强AiCoin平台数据广度,同时彰显WEEX在品牌公开性和市场透明度方面的升级。WEEX此前已与TradingView集成,此次合作将进一步触达专业投资者群体。作为华语区领先的加密行情平台,AiCoin凭借丰富数据维度和强大分析工具深受专业投资者青睐。WEEX目前支持15种语言,全球用户超620

  • 海光信息与光亚鸿道达成战略合作

    5月29日,海光信息与光亚鸿道签署战略合作协议,将围绕鸿道操作系统开展芯片适配与生态建设深度合作。此次合作标志着国产芯片与操作系统在机器人领域的垂直整合迈出关键一步。海光的CPU、DCU等核心产品将与鸿道系统深度适配,构建从底层指令集到上层应用的完整技术链,为机器人产业提供全栈国产化解决方案。鸿道操作系统作为国家新型工业化操作系统,采用"大脑-小脑协同"类脑架构设计,已通过多项功能安全认证。双方合作填补了国内"芯片+系统"协同创新空白,将提升算力效能与安全可靠性,为智能制造等领域提供安全可控的技术底座。这种"国家队+生态链"的创新模式,正在重塑全球机器人产业竞争格局。

  • 开启AI+AR导航新生态,雷鸟创新与高德地图达成战略合作

    5月22日,消费级AR品牌雷鸟创新RayNeo与高德地图达成战略合作。双方将在AI与AR眼镜的地图导航、视觉信息服务、AI Agent等领域展开深度合作,探索空间计算技术在智能出行和城市生活中的应用场景。合作将融合雷鸟在AR眼镜和空间交互技术方面的优势,以及高德在地图数据、位置服务和AI大模型领域的积累,打造新一代AI+AR智能导航解决方案。未来双方将持续探索AR+导航新方式,通过AI大模型、高德Agent等技术,为用户提供更直观高效的导航与生活服务体验。此次合作标志着AI与AR技术在地图导航领域迈出关键一步。

  • 广汽丰田官宣与小米汽车合作 接入小米“人车家”生态

    今日,在广汽丰田举办的科技日活动上,一系列重磅合作信息公布。广汽丰田宣布与华为、Momenta、小米达成合作,并正式接入小米“人车家”生态。这一举措意味着未来广汽丰田的车型将与小米生态实现深度融合,其中铂智7将率先开放硬件生态接口。

  • 字节跳动警告合作方 对腐败贿赂员工零容忍

    字节跳动发布端午合规提示,明确对腐败贿赂行为零容忍。文件规定:合作方若向员工行贿或谋取不当利益,将被永久列入黑名单;节日期间禁止赠送粽子礼盒、现金红包等礼品;不得提供高档餐饮娱乐招待。2024年公司已辞退353名违规员工,其中39人移送司法机关。此举彰显字节跳动反腐决心,旨在维护廉洁透明的商业合作环境。(140字)

今日大家都在搜的词: