首页 > AI头条  > 正文

OpenBuddy开源大语言模型团队发布Llama3.1-8B模型中文版

2024-07-25 08:35 · 来源: AIbase基地

Meta最近发布了新一代开源模型系列Llama3.1,其中包括一个405B参数的版本,其性能接近甚至在某些基准测试中超越了GPT-4等闭源模型。Llama3.1-8B-Instruct是该系列中的一个8B参数版本,支持英语、德语、法语、意大利语、葡萄牙语、西班牙语、印地语和泰语,上下文长度高达131072tokens,知识截止日期更新至2023年12月。

为了增强Llama3.1-8B-Instruct的能力,Meta在训练中使用了超过2500万条合成数据,这些数据由更大的405B模型生成。这使得Llama3.1-8B-Instruct在代码、数学等测试中表现出与GPT3.5Turbo相近的认知和推理能力。

微信截图_20240725083410.png

OpenBuddy利用Llama3.1-8B-Instruct模型,通过在少量中文数据上进行训练,发布了OpenBuddy-Llama3.1-8B-v22.1-131K,这是一个具备中文问答和跨语言翻译能力的新一代开源跨语言模型。尽管Llama3.1本身不具备中文能力,但经过训练后,该模型在一些容易产生概念混淆的问题上能够生成通常只有更大模型才能生成的答案,显示出更强的认知潜力。

然而,由于训练数据集和时间的限制,OpenBuddy-Llama3.1-8B-v22.1在中文知识,特别是传统文化知识上仍存在局限。尽管如此,模型在长文理解等任务上表现出相对稳定的表现,这得益于其原本的长文能力。

未来,OpenBuddy计划对8B和70B模型进行更大规模的训练,以增强模型的中文知识储备、长文能力和认知能力,并探索微调405B模型的可能性。

项目地址:https://modelscope.cn/models/OpenBuddy/openbuddy-llama3.1-8b-v22.1-131k

  • 相关推荐
  • AI日报:智谱AI发布AutoGLM 2.0;腾讯元宝接入腾讯视频;字节发布开源大语言模型 Seed-OSS

    本期AI日报聚焦多项AI技术突破:智谱发布革命性语音代理AutoGLM 2.0,实现全平台语音操控;腾讯元宝接入视频平台提升观影便捷性;字节跳动开源大模型Seed-OSS专注长文本处理;速卖通AI代理助力新品推广效率翻倍;微软测试Copilot智能文件搜索功能;Liquid AI推出低延迟视觉语言模型LFM2-VL;OpenAI月收入首破10亿美元;谷歌Pixel 10系列全面升级AI功能,包括情感识别和实时翻译;Pixel Buds Pro 2引入AI手势控制;ElevenLabs发布支持70+语言的文本转语音API。

  • 王宁掏出迷你版LABUBU

    “这周就要发布Mini版LABUBU,以前可能大家是挂在包上,可能从下周开始,大家甚至可以挂在手机上,它的使用场景会更多,相信它会是一个超级受欢迎的爆款。” 8月20日,在泡泡玛特2025年中期业绩发布会上,泡泡玛特董事长兼CEO王宁化身“带货博主”,从胸前西装口袋中拿出了一个Mini版LABUBU介绍道。 这款即将登场的 Mini 版 LABUBU 仅有掌心大小,延续了LABUBU标志性的搪胶毛�

  • 泡泡玛特不止一个LABUBU

    不可否认,在本周举办的泡泡玛特中期业绩发布会上,LABUBU依然是最引人瞩目的话题中心。THE MONSTERS系列2025H1收入达到48.1亿元,同比增长668%,新品MINI LABUBU即将发售的消息也在海内外社媒引发巨大反响。 尽管位列所有IP第一,THE MONSTERS系列在总收入中的占比也刚刚接近35%。2025年H1,泡泡玛特自有IP中有5个收入超10亿,收入过亿的IP更是达到13个,这其中有MOLLY这样历经十数年的�

  • 泡泡玛特王宁:本周将发布迷你版LABUBU

    昨日,泡泡玛特公布了其2025年中期业绩报告,数据显示,报告期内公司收益高达138.76亿元,与去年同期相比增长了204.4%,业绩表现十分亮眼。 在今日举行的泡泡玛特2025年中期业绩会上,创始人兼CEO王宁对公司未来发展充满信心。他透露,原本公司希望今年营收能够达到200亿,但就目前情况来看,实现300亿的营收目标也颇为轻松。

  • AI日报:AI内容新规正式生效;美团推出开源大模型LongCat;阶跃发布语音大模型Step-Audio 2 mini

    AI日报栏目每日更新AI领域热点内容,聚焦开发者需求。本期重点包括:阶跃星辰发布端到端语音大模型Step-Audio2 mini,在多项基准测试中表现优异;9月1日起AI生成内容需强制标识;美团推出开源大模型LongCat;上海AI实验室发布多模态大模型InternVL3.5;腾讯ARC团队推出音频生成模型AudioStory;OpenAI发布实时语音模型GPT-realtime;Meta与UCSD合作推出DeepConf技术;xAI代码库遭窃事件;阿里巴巴Qwen团队发布GUI自动化框架;微软推出Copilot Labs实验中心;小红书自动化工具xiaohongshu-mcp上线。

  • AI日报:Wan 2.2-S2V模型即将发布;​字节跳动内测3D Model Generator;微软开源 VibeVoice-1.5B 模型

    本期AI日报聚焦多项技术突破:阿里通义万相发布Wan 2.2-S2V模型,实现视频音频同步生成;字节跳动研发3D模型生成工具,降低建模门槛;面壁智能推出MiniCPM-V4.5端侧多模态模型;苹果提出RLCF训练法提升模型性能;微软开源VibeVoice-1.5B支持超长语音合成;谷歌Imagen 4正式上线;英伟达发布Jetson Thor机器人计算平台;Genspark推出AI Designer一键生成品牌方案;豆包上线未成年人保护模式。

  • 三星推出Galaxy Buds3 FE耳机新品:带来更加智能、时尚的音频新体验

    三星电子于2025年8月18日发布新款智能耳机Galaxy Buds3 FE,主打亲民价格与高端性能。新品延续标志性刀锋设计,配备升级版主动降噪(ANC)和Galaxy AI功能,支持跨设备无缝切换和语音交互。通过增强型扬声器实现三频均衡音效,超宽频通话技术确保清晰沟通。耳机采用哑光双色半透明设计,支持与三星生态设备联动,提供智能翻译等AI功能。将于9月5日上市,提供银雾灰、暗羽黑两种配色,进一步扩展三星Galaxy生态体验。

  • OpenAI的开源模型现已在IBM watsonx.ai上提供

    OpenAI发布两款开源AI模型GPT-OSS-120B和GPT-OSS-20B,允许开发者自由下载、运行和定制。其中120B模型已部署在IBM Watsonx.ai平台,采用专家混合架构,支持本地或云端部署,不受商业用途限制。模型具备高透明度,输出完整推理链,在多项基准测试中表现优异。此次发布标志着OpenAI首次加入开源生态,IBM强调其开放战略,为企业提供灵活、安全的AI开发选择。

  • OpenAI发布语音模型GPT-realtim:具备情感感知能力 多语言无缝切换

    OpenAI正式发布语音模型GPT-realtime。 据介绍,GPT-realtime是一款专注于语音AI Agent的多模态模型,能够生成高度自然流畅的语音,精准还原人类语调、情感和语速的丰富变化。该模型支持图像理解,并可结合语音或文本对话使用,非常适合应用于客服、教育、金融、医疗等领域,用于构建高质量的语音智能体。 官方表示,新模型在复杂指令遵循、工具精确调用以及生成更自然、�

  • 迷你LABUBU开售后卖爆 多平台已售罄:电商平台销量破百万

    昨晚22时整,泡泡玛特旗下备受瞩目的迷你版LABUBU系列新品正式开售,迅速点燃了消费者的热情。该系列单个盲盒定价79元,若整套购买则需1106元。其中,主打款心底密码系列搪胶毛绒挂件盲盒更是成为抢购焦点,上线瞬间即被抢购一空。 不少网友提前守候在购买页面,准备第一时间抢购。然而,当时间一到,小程序页面迅速显示“太火爆了”,随后便提示商品已售罄,让众�

今日大家都在搜的词: