首页 > 业界 > 关键词  > AI最新资讯  > 正文

Llama3-V:全新开源视觉大语言模型正式亮相

2024-05-29 09:07 · 稿源:站长之家

AI界近日迎来了一项重大突破,一款名为Llama3-V的全新开源视觉大语言模型正式亮相。据称,Llama3-V基于Llama38B和siglip-so400m构建,被业界誉为最先进的视觉大语言模型之一。该模型不仅性能卓越,还具备快速的本地推理能力,极大地方便了用户的操作。

Llama3-V的关键特点包括:性能上优于LLaVA约10-20%,训练成本控制在 500 美元以下,并且能够与GPT4-V、Gemini Ultra和Claude3 等顶尖模型相媲美。此外,Llama3-V的权重、训练和推理代码将全部开源,鼓励更多开发者参与到模型的开发和优化中。

目前,Llama3-V已经在Hugging Face平台和Github上发布,迅速吸引了广泛的关注和好评。这款模型不仅在性能上超越了以往的同类产品,更以其较小的模型体积实现了与大型模型相媲美的性能,展现了其卓越的性价比。

Llama3-V的推出预示着AI领域将迎来新的发展机遇。业界普遍期待,这款模型将为人工智能领域带来哪些突破性的创新和变革。

了解更多信息,请访问:

HF Model:https://huggingface.co/mustafaaljadery/llama3v

Github Repo:https://github.com/mustafaaljadery/llama3v

Uploaded Image

随着Llama3-V的加入,AI领域的发展将更加多元化和充满活力。让我们共同期待Llama3-V在未来AI应用中的精彩表现。

举报

  • 相关推荐
  • AI日报:通义千问开源Qwen3向量模型;字节跳动图像编辑模型SeedEdit 3.0;ElevenLabs推v3语音模型

    本文汇总了近期AI领域的重要动态:1)通义千问发布Qwen3-Embedding系列模型,在多语言文本处理表现优异;2)字节跳动推出图像编辑模型SeedEdit3.0,提升细节保持能力;3)ElevenLabs发布情感语音合成系统Eleven v3 Alpha;4)Anthropic推出面向国家安全的Claude Gov模型;5)可灵AI月收入连续两月超1亿元;6)Meta公布智能眼镜Aria Gen2技术细节;7)爱诗科技上线AI视频工具"拍我AI";8)富国银行预测2030年ChatGPT广告收入将达千亿美元。

  • 全球首款鸿蒙折叠电脑!华为MateBook Fold非凡大师正式亮相

    华为在5月19日新品发布会上推出全球首款鸿蒙折叠电脑MateBook Fold非凡大师。该产品采用超轻薄折叠设计,展开仅7.3mm厚、重1.16kg,配备18英寸全球最大折叠屏,合上后仅13英寸。提供锻影黑、天际白、云水蓝三种配色,采用锻压云纹、乌金腰线等设计元素,搭载鸿蒙操作系统5。余承东表示,该产品成功解决了大屏与便携难以兼得的难题,兼顾时尚美学与沉浸体验。

  • 小米Civi 5 Pro官宣5月发布:外观正式亮相

    小米集团总裁卢伟冰宣布,小米Civi5 Pro将于本月发布。新机采用圆形Deco三摄设计,配备横置闪光灯和徕卡Logo,辨识度高。核心配置搭载高通第四代骁龙8s处理器,采用台积电4nm工艺,CPU性能提升31%,GPU性能提升49%。配备1.5K全等深微曲屏,前后摄像头均针对暗光环境优化,内置5000万像素长焦镜头和6000mAh大电池。延续轻薄设计风格,在性能和影像能力上全面升级,有望成为Civi系列史上最强机型。

  • AI日报:阿里开源长文本深度思考模型QwenLong-L1;GPT-4o语音模式上线唱歌功能;秘塔AI搜索推出全新“极速”模型

    本文汇总了AI领域最新动态:1)中国信通院发布智能体开发标准,推动AI商业化进程;2)阿里推出QwenLong-L1-32B长文本推理模型,性能媲美Claude-3;3)GPT-4o语音模式升级,新增唱歌功能;4)秘塔AI搜索推出极速模型,响应速度达400tokens/秒;5)谷歌发布LMEval评估框架,统一大模型评测标准;6)Chrome浏览器集成Gemini AI助手;7)阿联酋全民免费使用ChatGPT Plus;8)苏州成立60亿元AI产业基金;9)法国Kyutai实验室推出10秒定制语音的Unmute系统;10)UAV-Flow项目实现无人机语音精准控制;11)Claude将升级支持百万字上下文和记忆功能;12)百度心响iOS版上线;13)夸克推出高考深度搜索功能;14)Chrome v137开发者工具升级;15)美团AI业务接近GPT-4o水平;16)Direct3D-S2实现3D生成速度提升10倍;17)OpenAI计划2026年推出首款AI硬件。

  • 荣耀400系列正式亮相:首发流光织锦工艺 每一台都独一无二

    其中,海风蓝、流沙粉是这次主打色,采用了全球首发的流光织锦”工艺,将真丝感纤维与贝母珠粉等材料,在真空环境中层层压制融合。 随机切割下,让每一块背板设计都与众不同,就像每一缕海风、每一捧流沙,都是独一无二。 这次荣耀400系列共有两款机型,分别是荣耀400、荣耀400 Pro。 其中,荣耀400采用直边直屏方案,荣耀400 Pro则是等深四曲屏。

  • 上市即交付!小鹏MONA M03 Max正式面向全国发运

    小鹏汽车宣布,小鹏MONA M03 Max版已正式面向全国发运,预计将在5月28日上市后立即开启交付。 此次推出的Max版将包括502长续航Max和600超长续航Max两个版型,均搭载图灵AI辅助驾驶功能以及天玑车机系统。 在外观设计上,小鹏MONA M03 Max与在售车型保持一致,全系新增星暮紫、微月灰、星雨青车漆颜色,同时取消了星耀蓝、星阙灰颜色。 此外,全系还增加了18英寸低风阻轮辋和1

  • 华为正式发布HUAWEI MateBook Fold 非凡大师,非凡大师家族迎来全新成员

    5月19日,华为发布nova14系列及鸿蒙电脑新品,推出全球首款18英寸商用折叠笔记本HUAWEI MateBook Fold非凡大师,展开仅7.3mm厚、1.16kg重,搭载3.3K高刷屏和HarmonyOS 5系统,支持多形态转换。同时发布HUAWEI MateBook Pro,重970g,配备OLED护眼屏,售价7999元起。还推出首款鸿蒙商用笔记本擎云HM940,启动"擎云星河计划"推动行业数字化转型。MateBook Fold提供32GB+1TB(23999元)和32GB+2TB(2699

  • 一句话搞定金融复杂工作,容联云大模型知识助理全新升级!

    容联云大模型知识助手全新升级,聚焦"更高效率、更懂金融、更好体验",推出实时语音问答与语音检索两大核心功能。升级亮点包括:1)秒级响应的实时语音问答,支持复杂金融政策解读和理财产品对比分析;2)语义穿透的实时语音检索,可精准定位海量金融文档关键信息,检索效率提升40%;3)深耕金融领域知识,深入理解业务逻辑,提供专业可靠支持;4)支持多音色切换,满足个性化需求。该助手已应用于内部管理、统数运营、营销增长和客户服务四大场景,显著提升业务效率,如客户咨询转化率提升30%、业务办理效率提升60%。

  • AI日报:昆仑万维天工超级智能体APP上线;谷歌重磅发布三大Gemma模型变体;字节推出开源多模态模型BAGE

    本文介绍了AI领域最新动态:1)昆仑万维推出全球首款AI+Agent架构的Office智能体应用;2)研究显示ChatGPT能提升K12学生成绩近87%;3)谷歌视频生成工具Veo3扩展至更多地区;4)谷歌发布三款Gemma模型变体,覆盖医疗、手语翻译和海豚语言研究;5)VideoTutor实现一句话生成定制教学视频;6)字节跳动开源多模态模型BAGEL;7)Rork支持无代码开发iOS/Android应用;8)AingDesk降低AI助手开发门槛;9)Claude4登陆亚马逊Bedrock平台;10)Youware通过MCP协议提升网页生成能力。这些创新展示了AI技术在各领域的快速发展和应用潜力。

  • 华为Pura 80系列预装鸿蒙5.1:小艺全新升级AI视觉能力 随身导游

    今天下午华为Pura 80系列正式发布,新机出厂搭载最新的鸿蒙5.1系统,为用户带来前所未有的智能体验。 其中,全新小艺再升级,新増AI视觉识别能力,能够精准捕捉并理解用户需求,识别周边的一切。