首页 > 业界 > 关键词  > LLaVA1.6最新资讯  > 正文

LLaVA-1.6来了!赶超Gemini Pro 提升推理性能

2024-02-01 14:08 · 稿源:站长之家

要点:

1、LLaVA-1.6提升了推理、OCR能力,支持更多场景和广泛用户。

2、LLaVA-1.6在多项基准测试中超越了Gemini Pro,并优于Qwen-VL-Plus。

3、LLaVA-1.6展现出强大的零样本中文能力,取得了SOTA性能。

站长之家(ChinaZ.com)2月1日 消息:LLaVA-1.6是一项新的技术成果,通过提升推理、OCR能力以及支持更多场景和广泛用户,为用户带来更好的体验。LLaVA-1.6不仅在多项基准测试中超越了Gemini Pro,并且优于Qwen-VL-Plus,展现出了强大的性能。

同时,LLaVA-1.6还展现出强大的零样文能力,取得了SOTA性能。这项技术的发布,将会给用户带来更广泛的应用场景和更好的体验。

image.png

项目地址:https://github.com/haotian-liu/LLaVA

在LLaVA-1.6中,通过提升输入图像分辨率和改进视觉指令调整数据混合,使得该技术能够掌握更多的视觉细节,获得更好的视觉推理和OCR能力。此外,LLaVA-1.6还覆盖了更多世界知识,具备更好的逻辑推理能力,实现了SOTA性能。LLaVA-1.6的发布,对于提高多模态技术在不同场景下的应用潜力有着重要的意义。

通过LLaVA-1.6的发布,研究团队表示将继续探索更多的LLM方案,包括Mistral-7B和Nous-Hermes-2-Yi-34B,以使LLaVA能够支持更广泛的用户和更多的场景。这表明,LLaVA将继续保持技术创新,不断提升用户体验,满足不断变化的市场需求。LLaVA-1.6的发布将为未来的多模态技术发展指明了方向。

LLaVA-1.6在推理、OCR能力的提升以及对更广泛用户和更多场景的支持方面表现出了强大的性能,展现了SOTA的实力。这将对多模态技术的发展产生积极的推动作用,为用户带来更广泛的应用场景和更好的体验。

举报

  • 相关推荐
  • AI日报:支付宝推AI创意生成平台;谷歌王炸推理模型Gemini2.0 Flash Thinking;Runway支持插入中间帧;OpenAI准备o3推理模型

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、谷歌发布王炸推理模型Gemini2.0FlashThinking,挑战OpenAIo1谷歌近期推出的Gemini2.0FlashThinking模型在多模态推理领域展现出强大的能力,支持32,000个输入标记和8,000个输出标记,极大提升了处理复杂问题的效率。与前代产品相比,Falcon3的训练规模翻倍,展现出强劲的竞争力,尤其是在与其他主流开源模型的基准测试中表现优异。

  • 可灵1.6模型发布:文本响应度、运动合理性明显提升

    快科技12月20日消息,近日快手可灵AI宣布基座模型再升级,视频生成推出可灵1.6模型。据快手官方介绍,1.6模型在文本响应度、画面美感及运动合理性上均有明显提升,画面更稳定更生动,对运动、时序类动作、运镜等文字描述响应更好。并且动态质量进一步增强,运动更加合理,人物表情更自然;同时1.6模型画面质量也再次进化,色彩、光影、细节表现均明显提升,提供支持标准和高品质模式,图生视频效果提升同样显著。此前在今年9月份,可灵AI 1.5模型上线,当时就已经支持高品质模式,与可灵1.0模型只能生成最高720P的视频不同,可灵1.5模型则

  • 见多识广的你,知道Mini SSD吗?

    在全球数字化转型加速的背景下,存储设备已不再是单纯的数据存储工具是推动信息安全、提升运算效率和支持业务创新的关键基石。

  • iPad Air/iPad mini将升级OLED:苹果即将淘汰LCD

    据DSCC报告,苹果正在将OLED扩展到iPad产品线上。8.5英寸OLEDiPadmini将于2026年推出,11英寸/13英寸OLEDiPadAir将于2027年推出,预计到2027年,除了低成本的iPad使用LCD外,苹果绝大部分iPad产品都将转向OLED。不过目前双串联OLED成本很高,未来很长一段时间内,它都是iPadPro独占的屏幕,iPadAir以及iPadmini等产品都将配备单程OLED。

  • Mini LED电视画质遇瓶颈?还得是万象分区“一区顶多区”!

    这年底是真热闹,荣耀、OPPO、一加等手机品牌纷纷抢在年底召开新品发布会,不过啊,手机圈的热闹可以说是各路神仙打架,但电视圈这边呢,TCL的一场“新技术发布会”就直接炸了场子,把电视圈搅得风起云涌,电视界的大佬地位,不服不行!发布新品开发布会挺常见的,但要是同时开上了新技术发布会,那无疑意味着这款产品所搭载的技术已经强大到足以引起一波新的潮流,不一定非得依赖某款具体产品衬托。技术发力、产品助力、销量给力,面对TCL这种“六边形战士”,友商接下来可真得好好想想怎么应对了。

  • iQOO Z10 Turbo Pro跑分现身:多核性能超越骁龙8 Gen2

    今日一款vivo新机的跑分数据现身Geekbench数据库,新机在Geekbench6.1.0版本中取得了单核1967分、多核5827分的成绩。根据跑分信息来看,新机的CPU搭载了1*3.21GHz3*3.01GHz2*2.80GHz2*2.02GHz核心,GPU为Adreno825,预计为骁龙8sElite处理器,其多核性能超越了骁龙8Gen2旗舰平台。预计iQOOZ10TurboPro还将搭载独立显卡芯片,支持游戏插帧、超分辨率和画质增强等功能,大幅提升游戏画面流畅度和视觉体验。

  • Mini LED电视不迷茫,TCL万象分区让你买对不买亏

    俗话说得好,买新不买旧,在选购MiniLED电视时尤为如此。如果不小心,可能就花了大价钱买了个过时的产品。TCL将在今年的旗舰X系列中继续沿用万象分区技术,同时引入前沿的RGB-MiniLED技术,会有更好的色彩表现。

  • 说点导购避而不谈的大实话,现阶段买Mini LED电视先看这几项!

    买MiniLED电视一定离不开谈及“背光”,过去无论是导购亦或是厂家都会告诉你,背光分区数越多,控光就会越精细,画质也就越好,然如果往后导购还在和你说这套话术可得注意了!如果现在买MiniLED电视看背光分区还在“唯数量论”,那你很可能会入手到一台只有高参数title,却没有实质性高画质的电视,由于分区数达到一定数量后会进入一个平台期,出现边际递减效应,即便分区数量增加到了很高,但是电视画质无法得到同样有效的画质提升,行业也因此进入了僵局!前几天据圈内资深人士爆料,TCL明年的旗舰X系列产品将会沿用万象分区并且还会搭载上RGB-MiniLED技术,如果对这项色彩新技术有所了解的应该会知道,它是将背光层的单色灯珠变为三原色的灯珠从生成彩色背光,类似于“三生万色”这样的感觉RGB-MiniLED显示技术能够一定程度上提升色域和色准值,TCL也是最早掌握这项技术的企业,但这项技术过去有一个难点在于三原色灯珠的稳定性和背光串色问题如今有了万象分区这项底层技术支持,该难题或将被解决,具体听闻会在明年的CES展会上揭晓,咱们就静候惊喜,期待一下吧!

  • 天玑9400小屏旗舰!OPPO Find X8 mini参数首度曝光

    博主数码闲聊站曝光了OPPOFindX8mini的细节参数。OPPOFindX8mini采用6.31英寸1.5KLTPO直屏,后置5000万三摄,包含一颗5000万像素潜望长焦,配备金属中框、玻璃机身,支持屏幕指纹,支持无线充电。这让寸土寸金的小屏旗舰得以塞下更大容量的电池,做到无明显短板的使用体验。

  • 小米Civi 5 Pro要首发!骁龙8s Elite规格出炉:性能超越骁龙8 Gen2

    博主@数码闲聊站最新爆料透露了高通SM8735/骁龙8sElite处理器部分参数,目前频率设定1*3.21GHz3*3.01GHz2*2.80GHz2*2.02GHz,Adreno825GPU。处理器大核架构还是X4A720,1322有点像骁龙8Gen3,目前跑分为1967/5827,骁龙8Gen3为2200/7000。屏幕还将支持超声波指纹识别。