首页 > 业界 > 关键词  > Llama3最新资讯  > 正文

大模型Llama 3正式发布 已达GPT4级别

2024-04-19 09:28 · 稿源:站长之家

站长之家(ChinaZ.com) 4月19日 消息:Meta公司宣布了一项重大技术进展,发布了其最新的开源模型——Llama3。这一模型包含两种参数规模:8B(80亿参数)和70B(700亿参数),预计将于今年7月正式面世。Llama3模型不仅具备多模态能力,还集成了新的计算机编码功能,能够输出文本和图像,预示着其未来将被应用于雷朋 Meta 智能眼镜等设备。

image.png

Meta公司与谷歌建立了合作伙伴关系,将实时搜索结果整合到 AI 助手的答复中,进一步提升了用户体验。与前代 Llama2相比,Llama3在多个行业基准测试中展现了突破性的性能,特别是在推理、代码生成和指令跟踪等方面取得了显著进步。为了训练这一模型,Meta 构建了两个包含2.4万个GPU的集群,其中1.6万个GPU同时用于Llama3的训练。

Llama3的开发预示着 Meta 在 AI 领域的雄心壮志。目前,公司正在开发的最大型模型拥有超过400B(400亿)的参数规模。Meta Llama3的主要性能特点包括:

模型规模与类型:提供8B和70B两种规模的预训练和指令调优生成文本模型,专为对话和其他语言处理任务优化。

模型架构:采用自回归方法和基于优化的变换器架构,引入了分组查询注意力机制,提升了大规模参数下的推理可扩展性。

训练与数据处理:使用超过15万亿的tokens进行预训练,训练集是Llama2的七倍,支持高达30种语言。

性能与基准测试:在多个自动化基准测试中表现出色,包括对话、问答、推理等多种任务,并特别针对现实世界场景进行了优化。

Meta 还发布了基于 Llama3的 AI 助手,目前已在美国之外的十多个国家推出。用户可以在 Facebook、Instagram、WhatsApp 和 Messenger 上使用 Meta AI 助手,它能够推荐餐厅、规划周末活动、协助学习等。此外,Meta AI 还整合了搜索功能,可以直接访问网络上的实时信息,无需切换应用。

Llama-3-70B-Instruct 已经登陆Hugging Chat ,可以在上面直接使用!

体验地址:https://www.meta.ai/

模型下载:https://top.aibase.com/tool/meta-llama-3

Hugging Chat:https://huggingface.co/chat/conversation/6621c6d78f6a88b6b6084ac4

举报

  • 相关推荐
  • 真学霸!豆包大模型1.6正式发布:高考数学卷获144分 全国第一

    今日,字节跳动旗下火山引擎举办FORCE原动力大会,正式发布豆包大模型1.6。 新系列包括三个大模型,分别是Doubao-Seed-1.6-thinking、Doubao-Seed-1.6、Doubao-Seed-1.6-flash。 火山引擎总裁谭待表示,Doubao-Seed-1.6是首个支持256k长上下文的大模型。 以thinking模型为例,其思考能力强化,支持多模态,Doubao-Seed-1.6则支持on/off/auto三种思考模式。 在高考全国新一卷数学单科测试中,豆包大模�

  • 7款AI大模型写高考作文,语文名师点评,豆包、GPT等斩获前三

    刚刚, 2025 年高考作文题目出炉,再次成为亿万网友关注的话题。越来越“聪明”的人工智能大模型写高考作文真题,会带给我们怎样的惊喜?阅卷老师又会给出怎样的分数呢?今年湖北高考语文采用全国一卷,作文题为根据给定的材料进行写作。根据阅卷老师的打分,豆包、通义千问、GPT-4o的作品斩获前三名。全国一卷阅读下面的材料,根据要求写作。( 60 分)他想要给孩子们唱

  • AI日报:豆包大模型1.6发布;OpenAI推o3-pro模型、o3价格暴降80%;Figma官方MCP重磅上线

    【AI日报】今日AI领域重要动态:1)火山引擎发布豆包大模型1.6和视频生成模型Seedance1.0pro,性能显著提升;2)OpenAI推出o3-pro模型,专注可靠性但响应较慢;3)Figma推出Dev Mode MCP服务,实现设计到代码一键转换;4)Krea AI发布图像生成模型Krea1,解决传统AI绘图问题;5)火山引擎豆包日调用量突破16.4万亿次;6)法国Mistral发布推理模型Magistral;7)苹果系统整合ChatGPT图像生成功能;8)OpenAI大幅下调o3价格80%并推出o3-pro;9)Hugging Face开源榜单显示中国团队Qwen与DeepSeek进入全球前15;10)阿里开源MaskSearch框架,提升AI解决复杂问题能力。

  • 小米史上最强大手机!小米16 Ultra Max型号首曝

    ,目前小米数字系列旗舰基本固定,以小米15系列为例,包括有小米15、小米15Pro、小米15Ultra。 这三个产品线算是小米数字系列的正统迭代。 S系列则是换芯小迭代,比如小米15S Pro就是各方面参数与小米15Pro保持一致,更换了玄戒O1芯片。 需要注意的是,最新爆料称小米16系列将新增两款机型:小米16Ultra Max、小米16S Ultra。

  • 有道14B低成本轻量模型“子曰3”开源,数学推理性能超越大模型

    网易有道6月23日开源国内首个专注数学教育的"子诳3"大模型系列数学模型(Confucius3-Math)。该模型在单块消费级GPU上高效运行,在多项数学推理任务中性能超越更大规模的通用模型,高考数学题测试得分达98.5分。其训练成本仅2.6万美元,推理性能是DeepSeek+R1的15倍,服务成本低至每百万token0.15美元,大幅降低教育AI应用门槛。该开源模型为教育公平提供低成本、高性能的AI�

  • OpenAI奥特曼:GPT5预计今年夏季发布

    OpenAI创始人奥特曼在最新播客中透露,GPT-5预计今夏发布,具体日期未定。 GPT-5将是生成式AI能力的重大升级,《商业内幕》称其远超GPT-4,早期测试者认可进步显著。 GPT-4于2023年3月发布,较上一代GPT-3.5有了显著提升。上月初,奥特曼发文向GPT-4告别。 目前GPT-4o已经完全替代了GPT-4,前者于2024年5月14日发布,其中o”代表omni”,意为 全能”。

  • 国内有哪些ai大模型?一文看懂中国核心AI大模型全景

    近两年中国AI大模型发展迅猛,已形成"通用+行业"双轨并进的生态格局。百度文心一言、阿里通义千问等通用大模型在中文理解、多模态生成等方面表现突出;深度求索DeepSeek以1/10参数实现GPT-4级推理能力;月之暗面Kimi以20万汉字上下文窗口领跑长文本处理;智谱AI的GLM-4成为首个支持视频对话的国产千亿模型。医疗、金融等垂直领域涌现出百川智能等专业模型,覆盖超1000家医院。开源生态加速国产芯片适配,15家厂商完成深度优化。行业应用方面,工程文档效率提升60%,24小时拟人化客服等案例凸显价值。未来趋势呈现模型蒸馏、端侧部署和开源生态三大方向,中国AI正从实验室走向产业变革前沿。

  • 预测大模型的工业生存法则,华为博士告诉你什么才是B端最需要的大模型!

    华为开发者大会2025期间,AI专家李良基与华为团队围绕预测大模型展开深度对话。华为提出"数据原子级表征体系"理念,旨在通过统一数据编码解决跨场景迁移难题。预测大模型已在钢铁行业成功应用,温度预测准确率远超传统方案。专家指出,AGI发展的核心在于构建知识迁移能力,未来将聚焦To B场景落地,通过统一架构实现跨领域泛化应用。华为云首创Triplet Transformer

  • 主流AI多模态大模型有哪些?超全的多模态大模型指南分享

    2024年多模态大模型成为AI领域最具前景的技术方向之一。文章全面分析了主流多模态大模型的特点、应用场景和发展趋势。多模态大模型能同时处理文本、图像、音频、视频等多种数据,实现更智能的人机交互。重点介绍了GPT-4V、Claude3.5、Gemini、通义千问等代表性模型,对比了它们在视觉理解、编程能力、中文处理等方面的优势。应用场景涵盖智能客服、内容创作、教育医疗等领域。未来发展趋势包括模型规模扩大、支持更多模态、实时交互能力提升等。选择模型需考虑应用需求、语言支持、性能成本等因素。

  • 行业最薄高端旗舰PC!荣耀MagicBook Art 14 2025正式发布:8499元起

    在今天的荣耀新品发布会上,荣耀MagicBook Art 14 2025终于正式发布。 具体价格如下: Ultra 5 255H/32GB/1TB售价8499元 Ultra 7 255H/32GB/1TB售价9499元 Ultra 7 255H/32GB/2TB售价9999元 荣耀MagicBook Art 14 2025延续了小镁本”的时尚美学设计,采用鲁班架构,产品最薄处仅为1cm、重约1kg,外观采用大量曲线设计,搭配蔓叶曲线设计,不仅美观,手感也更舒适,同时容纳众多接口。 在配色上,除了�