首页 > 业界 > 关键词  > Llama3最新资讯  > 正文

大模型Llama 3正式发布 已达GPT4级别

2024-04-19 09:28 · 稿源:站长之家

站长之家(ChinaZ.com) 4月19日 消息:Meta公司宣布了一项重大技术进展,发布了其最新的开源模型——Llama3。这一模型包含两种参数规模:8B(80亿参数)和70B(700亿参数),预计将于今年7月正式面世。Llama3模型不仅具备多模态能力,还集成了新的计算机编码功能,能够输出文本和图像,预示着其未来将被应用于雷朋 Meta 智能眼镜等设备。

image.png

Meta公司与谷歌建立了合作伙伴关系,将实时搜索结果整合到 AI 助手的答复中,进一步提升了用户体验。与前代 Llama2相比,Llama3在多个行业基准测试中展现了突破性的性能,特别是在推理、代码生成和指令跟踪等方面取得了显著进步。为了训练这一模型,Meta 构建了两个包含2.4万个GPU的集群,其中1.6万个GPU同时用于Llama3的训练。

Llama3的开发预示着 Meta 在 AI 领域的雄心壮志。目前,公司正在开发的最大型模型拥有超过400B(400亿)的参数规模。Meta Llama3的主要性能特点包括:

模型规模与类型:提供8B和70B两种规模的预训练和指令调优生成文本模型,专为对话和其他语言处理任务优化。

模型架构:采用自回归方法和基于优化的变换器架构,引入了分组查询注意力机制,提升了大规模参数下的推理可扩展性。

训练与数据处理:使用超过15万亿的tokens进行预训练,训练集是Llama2的七倍,支持高达30种语言。

性能与基准测试:在多个自动化基准测试中表现出色,包括对话、问答、推理等多种任务,并特别针对现实世界场景进行了优化。

Meta 还发布了基于 Llama3的 AI 助手,目前已在美国之外的十多个国家推出。用户可以在 Facebook、Instagram、WhatsApp 和 Messenger 上使用 Meta AI 助手,它能够推荐餐厅、规划周末活动、协助学习等。此外,Meta AI 还整合了搜索功能,可以直接访问网络上的实时信息,无需切换应用。

Llama-3-70B-Instruct 已经登陆Hugging Chat ,可以在上面直接使用!

体验地址:https://www.meta.ai/

模型下载:https://top.aibase.com/tool/meta-llama-3

Hugging Chat:https://huggingface.co/chat/conversation/6621c6d78f6a88b6b6084ac4

举报

  • 相关推荐
  • Meta说他们的 Llama 4 偏见少了!但,“虚假对等”才是真偏见

    Meta公司称,相比之前的版本,他们最新的人工智能模型Llama4的政治偏见更少了。其中一部分便是通过允许该模型回答更多带有政治争议性的问题来实现这一点的。下次当你使用Meta的AI产品时,它可能会为“通过服用马用镇静剂来治疗新冠病毒”这种观点说好话!

  • 实锤了,Llama 4重测排名掉至32名!远不及DeepSeek和Qwen

    LMArena更新了Meta最新发布的开源大模型Llama-4-Maverick的排名,从此前的第2名,直线掉到了第32名!这也实锤了此前开发者对Meta为刷榜排名向LMArena提供了“特供版”的Llama4大模型的质疑。开源版同款Llama-4-Maverick-17B-128E-Instruct在LMArena的排名为32名,远低于Gemini2.5Pro、GPT4o、DeepSeek-V3-0324、DeepSeek-R1、Qwen2.5-Max,甚至连英伟达基于上一代Llama3.3改造的Llama-3.3-Nemotron-Super-49B-v1都不如。

  • GPT4o生成的烂自拍,反而比我们更真实。

    文章探讨了GPT-4o通过简单Prompt生成的"不完美"照片引发热潮的现象。这些刻意追求平凡、模糊、构图混乱的照片,反而因其"不完美"带来了前所未有的真实感。作者指出,在社交媒体充斥精修照片的时代,这种未经修饰的"生活切片"恰恰捕捉了人类最熟悉的真实瞬间。通过分析911事件经典照片《坠落的人》,文章进一步论证了真实往往存在于未经表演的偶�

  • 为编程而生?OpenAI 发布 GPT -4.1 系列模型

    OpenAI 表示,GPT-4.1 是为开发者量身定制的……

  • 刚刚,OpenAI发布GPT-image-1模型,更强吉卜力版本来啦

    OpenAI发布全新图像生成模型GPT-image-1,通过API向全球开发者开放。该模型支持精细控制图像敏感度、生成效率、背景、输出格式等参数,并集成吉卜力模式。Adobe、Figma等企业已将其应用于产品中。API支持批量生成、蒙版编辑、透明度调整等高级功能,图像生成成本从0.02-0.19美元/张不等。CEO Sam Altman表示该模型与ChatGPT版本差异显著,开发者可通过API实现更多创意场景。新模型在�

  • 微软上线GPT-image-1模型 通过API向开发者开放使用

    OpenAI于4月24日发布全新图像生成模型GPT-image-1,通过API向全球开发者开放。该模型支持生成高质量图像,具备多级定制功能,包括控制敏感度、生成效率、背景、输出格式等参数,并推出"吉卜力模式"生成独特风格图像。Adobe、Figma等多家企业已将其集成到产品中。API定价按token计算,低质量图像生成成本约0.02美元/张。OpenAI CEO Sam Altman高度评价该模型,认为其为开发者带来更大创意空间。

  • AI日报:阿里通义千问Qwen3问鼎全球开源模型;Kimi长思考模型API发布;OpenAI发布新一代GPT-4.1模型

    【AI日报】汇总了近期AI领域重要动态:1)阿里通义千问3开源模型上线7天即登顶全球开源模型榜首,在指令遵循和推理能力上超越闭源模型;2)月之暗面推出Kimi长思考模型API,可解决复杂代码和数学问题;3)OpenAI发布GPT-4.1模型,性能提升显著;4)Google推出Gemini2.5Pro模型,提升开发者编码能力;5)联想发布"天禧超级智能体",具备多模态感知能力;6)腾讯元宝上线"对话分

  • 奔驰新款CLA接入豆包大模型

    4月22日,奔驰与火山引擎合作的首款国产纯电车型CLA全球首发亮相。该车搭载奔驰自研MB.OS架构,接入火山引擎大模型,支持个性化智能交互体验。智能系统可识别4种情绪并给予反馈,交互效率提升50%,唤醒仅需0.2秒。虚拟助手能解答百科问题并协助车辆功能设置。这是双方继2024年8月达成AI战略合作后落地的首款量产车型,结合生成式AI和大数据技术,为中国用户打造更智能的用车体验。

  • 首次实现图像思考 OpenAI重磅发布o3/o4-mini:史上最强、最智能模型

    快科技4月17日消息,今日,OpenAI新款AI模型o3、o4-mini重磅发布,这是OpenAI迄今最强、最智能的模型。据了解,OpenAI o3/o4-mini首次具备真正的视觉推理能力,看图识图已经是小菜一碟了,现在还会看图思考。OpenAI o3/o4-mini能同时处理文本、图像和音频,并且能作为Agent智能体自动调用网络搜索、图像生成、代码解析等工具以及深度思考模式。通过强化学习,OpenAI训练了o3/o4-mini如何�

  • 重磅!OpenAI确定GPT-4退役日期:430日

    快科技4月14日消息,据报道,OpenAI宣布,自2025年4月30日起,GPT-4将从ChatGPT中退役,由GPT-4o完全替代 ,不过GPT-4仍将在API中提供。OpenAI表示,在面对面的评估中,GPT-4o在写作、编码、STEM等方面持续超越GPT-4。最近的升级进一步改进了GPT-4o的指令跟踪、问题解决和对话流程,使其成为GPT-4的自然继承者。据悉,GPT-4于2023年3月发布,较上一代GPT-3.5有了显著提升。而GPT-4o是OpenAI为聊天