Llama3-V: 全新开源视觉大语言模型出世

2024-05-29 08:45 · 稿源：站长之家

近日，AI界掀起了一股新风潮，一款名为Llama3-V的全新开源视觉大语言模型横空出世!据悉，这款模型基于Llama38B和siglip-so400m，被称为最先进的视觉大语言模型之一。与此同时，该模型还具备快速本地推理的特点，让用户能够更加便捷地进行推理操作。

有关Llama3-V的一些关键特点包括:优于LLaVA约10-20%的性能表现、训练成本低于500美元以及可与GPT4-V、Gemini Ultra和Claude3相媲美的性能。同时，该模型的权重、训练和推理代码也将会开源发布，让更多的开发者能够参与其中。

现在，Llama3-V已经在Hugging Face平台和Github上发布，吸引了大量关注和好评。据悉，这款模型不仅能够优于以往的同类产品，还能够以更小的模型体积达到与其他大型模型相媲美的性能水平。

总的来说，Llama3-V的推出无疑将为AI领域带来一股新的风向，让我们拭目以待，看这款模型能为人工智能领域带来怎样的突破与创新!

HF Model：https://huggingface.co/mustafaaljadery/llama3v…

Github Repo：https://github.com/mustafaaljadery/llama3v

（举报）

相关推荐

关键词：

Lamett乐迈石晶快装秘籍！让武汉20年老宅“一键焕新”

武汉黄先生一家140平米老宅经《梦想改造家》节目改造后焕然一新。设计师采用零甲醛添加的Lamett乐迈石晶地板，解决潮湿问题，提升防滑耐磨性能。空间重构实现客卧对调、主卧休闲办公一体化，厨房岛台增进家人互动。全屋原木色调营造温馨氛围，兼顾健康与美学，为五口之家打造安全舒适的生活环境。

老宅改造空间规划梦想改造家
美团也开源了大模型，但我觉得他们的野心是通用生活Agent。

也有线上体验地址:https://longcat.ai 我自己去体验了一下，整体模型能力，中规中矩，但是快，是真的快，能把560B的模型，在推理的时候搞得这么快，是真的有点牛逼的。我直接录了个屏给大家看一下。这里我们可以直观对比一下LongCat和DeepSeek V3的输出速度，他俩都是MoE架构，而且总参数量差不太多。为了更公平的竞争，用了同一个问题，并关闭了联网搜索来避免搜索干扰�

美团 AI模型开源
荐AI日报：Wan 2.2-S2V模型即将发布；字节跳动内测3D Model Generator；微软开源 VibeVoice-1.5B 模型

本期AI日报聚焦多项技术突破：阿里通义万相发布Wan 2.2-S2V模型，实现视频音频同步生成；字节跳动研发3D模型生成工具，降低建模门槛；面壁智能推出MiniCPM-V4.5端侧多模态模型；苹果提出RLCF训练法提升模型性能；微软开源VibeVoice-1.5B支持超长语音合成；谷歌Imagen 4正式上线；英伟达发布Jetson Thor机器人计算平台；Genspark推出AI Designer一键生成品牌方案；豆包上线未成年人保护模式。

AI视频生成多模态AI 阿里通义万相
Lamett乐迈石晶产品硬核测评：零醛、防水、防霉三大指标重新定义健康家

北京楼市新政落地，市场活力提升，新房装修需求升温。文章重点指出选购健康安全建材的关键指标：甲醛释放量少、防水防潮性强、防霉防蛀能力过硬。通过高温甲醛实验、防水实验和防霉防蛀实验，对比测试了乐迈石晶板等主流建材，结果显示其具有零甲醛释放、滴水不侵、无惧虫霉的优异性能，重新定义了健康建材的标准。

北京楼市新政新房装修需求家装建材选择
荐AI日报：智谱AI发布AutoGLM 2.0；腾讯元宝接入腾讯视频；字节发布开源大语言模型 Seed-OSS

本期AI日报聚焦多项AI技术突破：智谱发布革命性语音代理AutoGLM 2.0，实现全平台语音操控；腾讯元宝接入视频平台提升观影便捷性；字节跳动开源大模型Seed-OSS专注长文本处理；速卖通AI代理助力新品推广效率翻倍；微软测试Copilot智能文件搜索功能；Liquid AI推出低延迟视觉语言模型LFM2-VL；OpenAI月收入首破10亿美元；谷歌Pixel 10系列全面升级AI功能，包括情感识别和实时翻译；Pixel Buds Pro 2引入AI手势控制；ElevenLabs发布支持70+语言的文本转语音API。

AI产品 AutoGLM 2.0
荐AI日报：AI内容新规正式生效；美团推出开源大模型LongCat；阶跃发布语音大模型Step-Audio 2 mini

AI日报栏目每日更新AI领域热点内容，聚焦开发者需求。本期重点包括：阶跃星辰发布端到端语音大模型Step-Audio2 mini，在多项基准测试中表现优异；9月1日起AI生成内容需强制标识；美团推出开源大模型LongCat；上海AI实验室发布多模态大模型InternVL3.5；腾讯ARC团队推出音频生成模型AudioStory；OpenAI发布实时语音模型GPT-realtime；Meta与UCSD合作推出DeepConf技术；xAI代码库遭窃事件；阿里巴巴Qwen团队发布GUI自动化框架；微软推出Copilot Labs实验中心；小红书自动化工具xiaohongshu-mcp上线。

AI 语音大模型 Step-Audio2mini
荐AI日报：腾讯开源3D世界模型HunyuanWorld-Voyager；即梦AI系列模型开放API；通义推智能体开发框架AgentScope 1.0

本文介绍了AI日报栏目，聚焦人工智能领域最新动态。主要内容包括：腾讯开源具备3D重建能力的HunyuanWorld-Voyager模型、通义实验室推出的多智能体开发框架AgentScope 1.0、即梦AI开放图像与视频生成API、腾讯翻译模型Hunyuan-MT-7B在WMT2025斩获佳绩、苹果推出图像生成技术STARFlow和视觉语言模型FastVLM、新模型CoMPaSS-FLUX.1提升空间理解能力、Cherry Studio免费提供Qwen38B模型、谷歌Gemini API新增网页内容解析功能，以及腾讯优图开源智能体框架Youtu-Agent。这些进展展现了AI技术在多个领域的创新与应用。

AI 3D重建腾讯开源
荐AI日报：字节OmniHuman-1.5发布；PixVerse V5模型上线；腾讯开源智能体框架Youtu-agent

本期AI日报聚焦多项技术突破：字节跳动发布OmniHuman-1.5实现图像音频秒变超真视频；爱诗科技PixVerse V5全球上线支持多场景创作；腾讯开源Youtu-agent框架提升AI开发效率；百度智能云发布百舸AI计算平台5.0；OpenAI将推出家长监控功能应对安全风险。同时涵盖硬件创新、市场预测及中国团队在全球AI应用领域的突出表现，展现人工智能领域快速发展的技术迭代与生态建设。

AI视频生成 OmniHuman-1.5 字节跳动
荐AI日报：抖音打击AI技术滥用行为；OpenAI 收购开发数据分析平台 Statsig；ElevenLabs 音效模型更新

抖音打击AI技术滥用行为，对违规商家和达人采取下架、清退等措施。ElevenLabs音效模型升级至版本2，支持长音频和无缝循环。OpenAI收购数据分析平台Statsig，增强产品迭代能力。亚马逊推出Lens Live AI功能，实时扫描购物。谷歌AI推出Stax工具，帮助开发者评估大语言模型。WordPress推出AI工具Telex简化网站构建。Liquid AI发布LFM2-VL模型，提升手机视觉语言处理。苹果开源FastVLM与MobileCLIP2模型，优化边缘设备AI应用。MetaGPT推出自动化测试工具RealDevWorld，精准率达92%。瑞士发布开源大模型Apertus，提供多语言处理能力。

AI技术滥用抖音公告虚假商品展示
如何快速精准计算AI大模型费用？试试这个三步完成的免费工具！

文章讲述AI项目预算失控的普遍现象：李工团队因手动计算GPT-4等大模型调用成本复杂，最终预算比实际支出少25%。行业调查显示73%团队曾因模型成本失控被迫调整项目。AIbase推出三步极速成本计算器解决痛点：1）集成50+主流大模型参数库；2）用自然语言描述需求即可生成预算；3）10秒输出详细成本对比报告。该工具已帮助电商企业节省40%预算，其优势在于实时追踪官方定价、智能匹配场景规则、自动生成多模型对比报告，让晦涩的token计价变得直观透明。目前已有超12万开发者使用该工具优化AI项目成本。

AI客服系统 GPT-4成本大模型预算

今日大家都在搜的词：

热文

3 天
7天

Llama3-V: 全新开源视觉大语言模型出世

Lamett乐迈石晶快装秘籍！让武汉20年老宅“一键焕新”

美团也开源了大模型，但我觉得他们的野心是通用生活Agent。

荐AI日报：Wan 2.2-S2V模型即将发布；字节跳动内测3D Model Generator；微软开源 VibeVoice-1.5B 模型

Lamett乐迈石晶产品硬核测评：零醛、防水、防霉三大指标重新定义健康家

荐AI日报：智谱AI发布AutoGLM 2.0；腾讯元宝接入腾讯视频；字节发布开源大语言模型 Seed-OSS

荐AI日报：AI内容新规正式生效；美团推出开源大模型LongCat；阶跃发布语音大模型Step-Audio 2 mini

荐AI日报：腾讯开源3D世界模型HunyuanWorld-Voyager；即梦AI系列模型开放API；通义推智能体开发框架AgentScope 1.0

荐AI日报：字节OmniHuman-1.5发布；PixVerse V5模型上线；腾讯开源智能体框架Youtu-agent

荐AI日报：抖音打击AI技术滥用行为；OpenAI 收购开发数据分析平台 Statsig；ElevenLabs 音效模型更新

如何快速精准计算AI大模型费用？试试这个三步完成的免费工具！

今日大家都在搜的词：

热文

小米澎湃OS 3首批Beta版更新“3.0.0.24”发布

华为发布首款MateTV：超薄设计搭载旗舰性能 8999元起预售

三大运营商回应是否支持eSIM版iPhone：需等待通知

OPPO A6 Pro定档 9 月 9 日发布：开启手机六年耐用新时代

AI日报：苹果明年推出SiriAI搜索；OpenAI放开ChatGPT Projects

尊界S800选配星空顶涨价3万：价格上调至 8 万元

苹果折叠屏iPhone或将采用真全面屏形态：告别刘海与挖孔

全新问界M7开售1小时订单破10万售价28.8万元起

AI日报：拍我AI接入Nano Banana；腾讯智影暂停服务；京东自研京

华为FreeBuds 7i无线耳机开售：首发价499元

雷军凌晨3点就奔赴阅兵观礼台佩戴小米AI眼镜前往

小米澎湃OS 3首批Beta版更新“3.0.0.24”发布

AI日报：腾讯开源3D世界模型HunyuanWorld-Voyager；即梦AI系列

华为发布首款MateTV：超薄设计搭载旗舰性能 8999元起预售

华为MatePad Mini外观公布支持蜂窝网络通话功能

AI日报：AI内容新规正式生效；美团推出开源大模型LongCat；阶跃

三大运营商回应是否支持eSIM版iPhone：需等待通知

人去世了朋友圈会消失？微信客服回应：建议保持账号活跃

腾讯回应被米哈游起诉：没正式程序不能违规提供QQ用户资料

OPPO A6 Pro定档 9 月 9 日发布：开启手机六年耐用新时代

站长商机