首页 > 业界 > 关键词  > 大模型最新资讯  > 正文

进的开源预训练大语言模型Lemur 平衡文本和代码功能

2023-09-04 10:10 · 稿源:站长之家

文章要点:

  • Lemur是首个在文本和代码任务上都表现卓越的开源预训练语言模型。

  • Lemur通过在大规模代码集上预训练,在文本理解和知识任务上保持竞争力的同时,在编程基准测试上超过其他模型。

  • Lemur填补了语言模型中文本和代码能力之间的空白,推动了开源LLM的发展。

随着语言和技术交叉的日益增多,对多功能和强大语言模型的需求也越来越大。传统的大型语言模型(LLMs)在文本理解或编码任务方面表现出色,但很少能够在两者之间达到平衡。这种不平衡为模型在文本推理和编码能力之间无法无缝切换留下了一定的空间。因此,Lemur和Lemur-chat应运而生,这两个开放预训练和监督微调LLMs的开创性贡献旨在弥合这一差距。

创建既能够熟练处理文本又能够处理代码的语言模型一直是一个长期存在的挑战。现有的LLMs通常专门用于文本理解或编码任务,但很少同时具备两者。这种专业化使得开发人员和研究人员需要在在两者之间进行选择。因此,需要一种LLMs,它能够提供全面的技能集,包括理解、推理、规划、编码和上下文基础。

image.png

项目地址:https://github.com/OpenLemur/Lemur

Lemur项目是由XLang Lab与Salesforce Research合作推出的,旨在解决语言模型技术中的关键差距。Lemur和Lemur-chat代表了一项开创性的努力,旨在开发开放的、预训练的和监督微调LLMs,其在文本和代码相关任务方面表现出色。这项工作的基石是对Llama2进行广泛的预训练,涉及约1000亿行代码密集型数据的大量语料库。这个预训练阶段之后是在约30万个公共教学和对话数据实例上进行的监督微调。结果是一个语言模型,具有增强的编码和基础能力,同时保持着竞争性的文本推理和知识性能。

Lemur和Lemur-chat的性能指标证明了它们的实力。Lemur在编码基准测试中超过了其他开源语言模型,证明了它的编码能力。同时,它在文本推理和知识性能方面保持了竞争优势,展示了它的多功能技能集。与此同时,Lemur-chat在各个方面显著优于其他开源监督微调模型,表明它在桥接对话环境中文本和代码之间的差距方面具有出色的能力。

Lemur项目是XLang Lab和Salesforce Research的协作研究成果,得到了Salesforce Research、Google Research和Amazon AWS的慷慨赠礼的支持。虽然朝着一个平衡的开源语言模型的旅程仍在持续,但Lemur的贡献已经开始重塑语言模型技术的格局。通过提供在文本和代码相关任务方面表现出色的模型,Lemur为寻求在语言和技术交叉领域中导航的开发人员、研究人员和组织提供了一个强大的工具。

总之,Lemur项目是语言模型领域创新的标志。它能够和谐地平衡文本和代码相关任务,解决了该领域长期存在的挑战。随着Lemur的不断发展和设立新的基准,它将推动代理模型的进一步研究,并为开源语言模型建立更强大和平衡的基础。有了Lemur,语言模型技术的未来将比以往任何时候都更加光明和多功能。

举报

  • 相关推荐
  • 突破大模型对齐瓶颈,北大团队携手昇腾打通产业应用通路

    北大杨耀东团队研发Align-Anything多模态对齐框架,以RLHF为核心解决传统反馈信息有限问题,覆盖文本、图像、音频等全模态数据。该框架集成专用评估工具Eval-Anything,已在昇腾平台实现智慧医疗、网络安全等领域规模化落地。通过构建安全治理体系,显著提升大模型安全水位,同时保持通用能力。团队联合推出课程培养人才,深化产学研协同,为多模态大模型发展提供关键技术支撑。

  • 2025乌镇峰会:易鑫发布汽车金融行业首个Agentic大模型XinMM-AM1

    易鑫集团在2025世界互联网大会乌镇峰会上发布汽车金融行业首个Agentic大模型XinMM-AM1。该模型具备300亿参数、响应延迟低于200ms等技术优势,能提升获客、风控与运营效率,优化用户体验。通过全链路智能决策能力,推动行业从"单点智能"转向"整体高效"。配套SaaS平台已覆盖超4万家经销商及百余家金融机构,显著提高融资通过率与业务质量,填补领域技术空白,引领汽车金融智能化发展。

  • AI日报:阿里千问APP公测;Veo 3.1上线多图参考;超级小爱AI大模型“随心修图”上线

    本期AI日报聚焦多项技术突破:阿里千问APP公测,基于Qwen3模型对标ChatGPT;谷歌Veo 3.1支持三图融合生成8秒视频;小米推出"随心修图"功能与7B多模态模型Miloco;谷歌Flow集成Nano Banana模型实现智能抠图;多模态AI工具DeepEyesV2可执行代码与网络搜索;NotebookLM升级支持图像导入检索;JetBrains推出DPAI Arena测试编码AI性能。全球AI竞争持续升温,产品迭代加速。

  • 登榜LMArena!文心大模型5.0-Preview文本能力国内第一

    11月8日,文心全新模型ERNIE-5.0-Preview-1022在LMArena大模型竞技场排名中位列全球第二、中国第一。该模型在创意写作、复杂长问题理解和指令遵循方面表现突出,超越多款国内外主流模型。创意写作可高效生成文章、营销文案等内容;复杂长问题理解适用于学术问答、报告分析等任务;指令遵循能力支持智能助理、代码生成等场景,为多领域内容生产提供高效支撑。

  • Billus AI高交会全球首发多模态大模型 以AI Agent重构创意产业文明进化路径

    2025年11月15日,Billus AI在高交会首发多模态大模型Billus0.57EDIT及“超级员工智能体”初阶版,依托自研生存式大模型与AI Agent技术,打破创意领域垂直局限,构建覆盖文创、时尚、艺术等全场景智能创作生态。该模型通过自然语言指令直达创意成果,实现从平面图到施工图的全流程高效生成。同时,Billus AI同步打造“创意设计超级员工+产业链智能体”体系,探索生成式创意与供应链智能推荐的新商业路径,助力行业从“经验驱动”向“数据智能”跃迁。

  • 易鑫正式发布汽车金融行业首个Agentic大模型

    易鑫在2025世界互联网大会乌镇峰会上发布汽车金融行业首个Agentic大模型XinMM-AM1。该模型参数量约300亿,响应延迟低于200毫秒,支持语音实时交互,单卡吞吐达370 tokens/秒,可提升获客、风控与运营效率,解决行业周期长、交互多、决策复杂等难题。易鑫作为AI驱动的金融科技平台,研发投入超20亿元,率先实现AI全场景应用,将持续推动智能汽车金融生态建设。

  • 新Siri或明年春季发布 苹果公司或引入谷歌Gemini大模型 AI技术

    苹果因自研大模型项目遇瓶颈,决定引入谷歌Gemini大模型升级Siri,计划每年支付约10亿美元获取定制化Gemini 2.5 Pro使用权。该模型拥有1.2万亿参数,将全面负责Siri的信息摘要、任务规划及复杂指令执行等核心功能,支持多模态交互和超长文本处理。升级版Siri预计2026年春季随iOS 26.4推送,后续将在WWDC大会展示进一步整合。苹果选择谷歌主要因成本优势、长期合作基础及Gemini领先性能。

  • 大模型+反诈+算力三重突破 腾讯云三项成果闪耀金融科技应用场景大赛

    10月30日,2025金融街论坛年会金融科技大会公布“金融科技应用场景大赛”终评结果。腾讯云“金融反电诈治理方案”与“基于TCS的AI异构算力管理平台”凭借技术创新性与场景落地能力,从全国89家机构的280个项目中脱颖而出,双双荣获“十佳应用奖”。腾讯混元大模型信贷助手方案获“探索实践奖”。三大方案在金融风控、算力基座及大模型应用三个关键领域展现突出优势,获专家团高度认可。大赛自2021年启动,已成为金融科技领域极具影响力的赛事平台。

  • 小米超级小爱AI大模型推出随心修图功能

    小米宣布超级小爱AI大模型推出随心修图功能,用户只需一句话即可轻松修出具有大片质感的照片。该功能有两种使用方式:在相册大图页面直接唤醒AI或通过应用上传照片并输入指令。使用需满足版本要求:超级小爱需v7.8.50及以上,相册编辑功能需v2.1及以上,相册本身需v4.3.0.30及以上。目前仅限Xiaomi HyperAI机型支持在相册大图页使用。超级小爱于2024年12月面向正式版用户开放升级,支持全局多模态交互和自然语音搜索,提升使用体验。

  • 简知科技“简智AI大模型”通过国家生成式人工智能服务备案,助力兴趣教育迈向智能化新阶段

    广州简知科技自主研发的“简智AI大模型”通过国家生成式人工智能服务备案,标志着该模型在安全性、合规性与可靠性方面达到国家级标准。作为兴趣教育领域AI应用的重要里程碑,该模型围绕用户兴趣成长周期设计,提供个性化学习支持:可为未明确兴趣方向的用户智能推荐内容,为入门用户规划学习路径,为基础扎实用户提供进阶训练与智能反馈。其技术能力在旗下“简小知”等品牌中已实现“学—练—评—测”全流程覆盖,并通过社群互动增强学习动力。公司未来将持续优化模型能力,联合行业伙伴构建完整培养体系,推动兴趣教育向个性化、高质量方向发展。

今日大家都在搜的词: