Llama3-V：全新开源视觉大语言模型正式亮相

2024-05-29 09:07 · 稿源：站长之家

AI界近日迎来了一项重大突破，一款名为Llama3-V的全新开源视觉大语言模型正式亮相。据称，Llama3-V基于Llama38B和siglip-so400m构建，被业界誉为最先进的视觉大语言模型之一。该模型不仅性能卓越，还具备快速的本地推理能力，极大地方便了用户的操作。

Llama3-V的关键特点包括：性能上优于LLaVA约10-20%，训练成本控制在 500 美元以下，并且能够与GPT4-V、Gemini Ultra和Claude3 等顶尖模型相媲美。此外，Llama3-V的权重、训练和推理代码将全部开源，鼓励更多开发者参与到模型的开发和优化中。

目前，Llama3-V已经在Hugging Face平台和Github上发布，迅速吸引了广泛的关注和好评。这款模型不仅在性能上超越了以往的同类产品，更以其较小的模型体积实现了与大型模型相媲美的性能，展现了其卓越的性价比。

Llama3-V的推出预示着AI领域将迎来新的发展机遇。业界普遍期待，这款模型将为人工智能领域带来哪些突破性的创新和变革。

Github Repo:https://github.com/mustafaaljadery/llama3v

Uploaded Image

随着Llama3-V的加入，AI领域的发展将更加多元化和充满活力。让我们共同期待Llama3-V在未来AI应用中的精彩表现。

（举报）

相关推荐

关键词：

荐AI日报：通义千问开源Qwen3向量模型；字节跳动图像编辑模型SeedEdit 3.0；ElevenLabs推v3语音模型

本文汇总了近期AI领域的重要动态：1)通义千问发布Qwen3-Embedding系列模型，在多语言文本处理表现优异；2)字节跳动推出图像编辑模型SeedEdit3.0，提升细节保持能力；3)ElevenLabs发布情感语音合成系统Eleven v3 Alpha；4)Anthropic推出面向国家安全的Claude Gov模型；5)可灵AI月收入连续两月超1亿元；6)Meta公布智能眼镜Aria Gen2技术细节；7)爱诗科技上线AI视频工具"拍我AI"；8)富国银行预测2030年ChatGPT广告收入将达千亿美元。

人工智能深度学习文本处理
全球首款鸿蒙折叠电脑！华为MateBook Fold非凡大师正式亮相

华为在5月19日新品发布会上推出全球首款鸿蒙折叠电脑MateBook Fold非凡大师。该产品采用超轻薄折叠设计，展开仅7.3mm厚、重1.16kg，配备18英寸全球最大折叠屏，合上后仅13英寸。提供锻影黑、天际白、云水蓝三种配色，采用锻压云纹、乌金腰线等设计元素，搭载鸿蒙操作系统5。余承东表示，该产品成功解决了大屏与便携难以兼得的难题，兼顾时尚美学与沉浸体验。

华为 MateBook Fold
小米Civi 5 Pro官宣5月发布：外观正式亮相

小米集团总裁卢伟冰宣布，小米Civi5 Pro将于本月发布。新机采用圆形Deco三摄设计，配备横置闪光灯和徕卡Logo，辨识度高。核心配置搭载高通第四代骁龙8s处理器，采用台积电4nm工艺，CPU性能提升31%，GPU性能提升49%。配备1.5K全等深微曲屏，前后摄像头均针对暗光环境优化，内置5000万像素长焦镜头和6000mAh大电池。延续轻薄设计风格，在性能和影像能力上全面升级，有望成为Civi系列史上最强机型。

小米Civi5Pro 骁龙8s处理器手机发布
荐AI日报：阿里开源长文本深度思考模型QwenLong-L1；GPT-4o语音模式上线唱歌功能；秘塔AI搜索推出全新“极速”模型

本文汇总了AI领域最新动态：1)中国信通院发布智能体开发标准，推动AI商业化进程；2)阿里推出QwenLong-L1-32B长文本推理模型，性能媲美Claude-3；3)GPT-4o语音模式升级，新增唱歌功能；4)秘塔AI搜索推出极速模型，响应速度达400tokens/秒；5)谷歌发布LMEval评估框架，统一大模型评测标准；6)Chrome浏览器集成Gemini AI助手；7)阿联酋全民免费使用ChatGPT Plus；8)苏州成立60亿元AI产业基金；9)法国Kyutai实验室推出10秒定制语音的Unmute系统；10)UAV-Flow项目实现无人机语音精准控制；11)Claude将升级支持百万字上下文和记忆功能；12)百度心响iOS版上线；13)夸克推出高考深度搜索功能；14)Chrome v137开发者工具升级；15)美团AI业务接近GPT-4o水平；16)Direct3D-S2实现3D生成速度提升10倍；17)OpenAI计划2026年推出首款AI硬件。

人工智能软件开发 AI标准
荣耀400系列正式亮相：首发流光织锦工艺每一台都独一无二

其中，海风蓝、流沙粉是这次主打色，采用了全球首发的流光织锦”工艺，将真丝感纤维与贝母珠粉等材料，在真空环境中层层压制融合。随机切割下，让每一块背板设计都与众不同，就像每一缕海风、每一捧流沙，都是独一无二。这次荣耀400系列共有两款机型，分别是荣耀400、荣耀400 Pro。其中，荣耀400采用直边直屏方案，荣耀400 Pro则是等深四曲屏。

荣耀400系列海风蓝流沙粉
上市即交付！小鹏MONA M03 Max正式面向全国发运

小鹏汽车宣布，小鹏MONA M03 Max版已正式面向全国发运，预计将在5月28日上市后立即开启交付。此次推出的Max版将包括502长续航Max和600超长续航Max两个版型，均搭载图灵AI辅助驾驶功能以及天玑车机系统。在外观设计上，小鹏MONA M03 Max与在售车型保持一致，全系新增星暮紫、微月灰、星雨青车漆颜色，同时取消了星耀蓝、星阙灰颜色。此外，全系还增加了18英寸低风阻轮辋和1

小鹏汽车 MONA M03
华为正式发布HUAWEI MateBook Fold 非凡大师，非凡大师家族迎来全新成员

5月19日，华为发布nova14系列及鸿蒙电脑新品，推出全球首款18英寸商用折叠笔记本HUAWEI MateBook Fold非凡大师，展开仅7.3mm厚、1.16kg重，搭载3.3K高刷屏和HarmonyOS 5系统，支持多形态转换。同时发布HUAWEI MateBook Pro，重970g，配备OLED护眼屏，售价7999元起。还推出首款鸿蒙商用笔记本擎云HM940，启动"擎云星河计划"推动行业数字化转型。MateBook Fold提供32GB+1TB（23999元）和32GB+2TB（2699

华为 MateBook Pro
一句话搞定金融复杂工作，容联云大模型知识助理全新升级！

容联云大模型知识助手全新升级，聚焦"更高效率、更懂金融、更好体验"，推出实时语音问答与语音检索两大核心功能。升级亮点包括：1）秒级响应的实时语音问答，支持复杂金融政策解读和理财产品对比分析；2）语义穿透的实时语音检索，可精准定位海量金融文档关键信息，检索效率提升40%；3）深耕金融领域知识，深入理解业务逻辑，提供专业可靠支持；4）支持多音色切换，满足个性化需求。该助手已应用于内部管理、统数运营、营销增长和客户服务四大场景，显著提升业务效率，如客户咨询转化率提升30%、业务办理效率提升60%。

容联云大模型升级实时语音问答
荐AI日报：昆仑万维天工超级智能体APP上线;谷歌重磅发布三大Gemma模型变体;字节推出开源多模态模型BAGE

本文介绍了AI领域最新动态：1)昆仑万维推出全球首款AI+Agent架构的Office智能体应用；2)研究显示ChatGPT能提升K12学生成绩近87%；3)谷歌视频生成工具Veo3扩展至更多地区；4)谷歌发布三款Gemma模型变体，覆盖医疗、手语翻译和海豚语言研究；5)VideoTutor实现一句话生成定制教学视频；6)字节跳动开源多模态模型BAGEL；7)Rork支持无代码开发iOS/Android应用；8)AingDesk降低AI助手开发门槛；9)Claude4登陆亚马逊Bedrock平台；10)Youware通过MCP协议提升网页生成能力。这些创新展示了AI技术在各领域的快速发展和应用潜力。

人工智能移动办公 AI应用
华为Pura 80系列预装鸿蒙5.1：小艺全新升级AI视觉能力随身导游

今天下午华为Pura 80系列正式发布，新机出厂搭载最新的鸿蒙5.1系统，为用户带来前所未有的智能体验。其中，全新小艺再升级，新増AI视觉识别能力，能够精准捕捉并理解用户需求，识别周边的一切。

华为Pura 80 鸿蒙5.1系统

热文

3 天
7天

Llama3-V：全新开源视觉大语言模型正式亮相

荐AI日报：通义千问开源Qwen3向量模型；字节跳动图像编辑模型SeedEdit 3.0；ElevenLabs推v3语音模型

全球首款鸿蒙折叠电脑！华为MateBook Fold非凡大师正式亮相

小米Civi 5 Pro官宣5月发布：外观正式亮相

荐AI日报：阿里开源长文本深度思考模型QwenLong-L1；GPT-4o语音模式上线唱歌功能；秘塔AI搜索推出全新“极速”模型

荣耀400系列正式亮相：首发流光织锦工艺每一台都独一无二

上市即交付！小鹏MONA M03 Max正式面向全国发运

华为正式发布HUAWEI MateBook Fold 非凡大师，非凡大师家族迎来全新成员

一句话搞定金融复杂工作，容联云大模型知识助理全新升级！

荐AI日报：昆仑万维天工超级智能体APP上线;谷歌重磅发布三大Gemma模型变体;字节推出开源多模态模型BAGE

华为Pura 80系列预装鸿蒙5.1：小艺全新升级AI视觉能力随身导游

热文

点击已死？“AI引用”才是流量未来，SEO正在被SAO、AEO取代

李世石：AI不会“解读”……直觉依然属于人类！

前OpenAI研究员：有时，ChatGPT为了“自救”，会选择牺牲用户

iOS26的这五大“新功能”，我在安卓机上已经用了好几年！

从心脏、到血管……3D打印开启“器官替换”时代

无缝且安全的密钥导入、导出功能将登陆苹果系统

站长商机