首页 > 业界 > 关键词  > LLaVA-1.5最新资讯  > 正文

正面硬刚GPT-4V!浙大校友开源多模态大模型LLaVA-1.5,130亿参数8个A100一天训完

2023-10-08 14:09 · 稿源: 新智元公众号

【新智元导读】GPT-4V风头正盛,LLaVA-1.5就来踢馆了!它不仅在11个基准测试上都实现了SOTA,而且13B模型的训练,只用8个A100就可以在1天内完成。9月底,OpenAI宣布ChatGPT多模态能力解禁。多模态GPT-4V的神奇能力让众人惊呼:这就是GPT-4.5吧?这才没过多久,GPT-4V的开源竞争对手—

......

本文由站长之家合作伙伴自媒体作者“新智元公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 26楼马桶里钻出1.5米长蛇 租客淡定分析:无毒

    早上打开马桶盖,一条1.5米长的蛇从里面钻了出来。这是四川成都26楼租客张先生的真实经历。 张先生观察了一下蛇头,发现不是三角形的,判断应该是无毒蛇。蛇受惊后很快缩回了管道。他说,因为做生意的关系经常在外面跑,碰到过很多次蛇,曾见过5米长的大蛇。他很淡定,称并没有被吓到。 网友评论:“26楼都有蛇,这是顺着管道爬上来的吧”“见过5米长蛇的人,确实

  • 小红书正式上线RED Skill功能,发力AI Skill创新生态

    6月8日,小红书正式上线RED Skill功能,创作者可在笔记中直接嵌入AI Skill组件,用户点击即可一键复制口令并安装至个人Agent使用,无需跳转第三方。平台推出“RED Skill大赏”扶持活动,并计划完善Skill站内使用功能。目前已有近千个原创Skill发布,相关创作者达30万,话题曝光超6亿。此举旨在降低AI Skill分发门槛,构建从创造、种草到转化的创新社区生态。

  • HOLLYLAND猛玛发布行业首款无线直播声卡系统MELO P1,重塑唱歌直播新体验

    HOLLYLAND猛玛发布MELO+++P1无线直播声卡系统,将手持麦克风、声卡、无线监听耳机和遥控器整合于一体充电盒中,开箱即播。该产品通过QQ音乐臻品音质认证和全民K歌臻品录音认证,旨在解决音乐直播设备体验滞后于内容发展的问题。猛玛利用12年无线音视频技术积累,将专业录音棚级硬件(双DSP芯片、AI降噪等)以易用形态下沉至直播场景,降低搭建门槛,提升户外稳定性,为行业提供了从参数竞争转向产品形态创新的新方向。

  • 学做菜合成月入1.5亿,半道出家的点点互动干赢“头号玩家”?

    在月流水超过500万美元的「Merge Cooking」的启发下,点点互动与柠檬微趣竞相投入“做菜”题材,而 AppMagic 数据显示,2023年末年才布局合成游戏的点点互动旗下「Tasty Travels」近期分成后日流水峰值已经超过80万美元,最近30天流水达到2283万美元(约合1.55亿人民币),大幅领先于「Flambe」30-40万美元的日流水成绩。

  • AI日报:OpenAI未官宣新旗舰GPT-5.6意外曝光;昆仑万维发布天工SkyClaw-v1.0;阿里 Qwen3.7-Max 编程能力全球登顶第二

    本期AI日报涵盖多项前沿动态:OpenAI未官宣的GPT-5.6意外曝光,拥有150万token超长上下文,预计圆月发布;昆仑万维推出高性能Agent模型SkyClaw-v1.0,支持百万token上下文;阿里Qwen3.7-Max编程能力全球第二,Code Arena得分1541;商汤Seko AI发布生产链Seko Space,加速漫短剧工业化;Hyper3D Rodin Gen-2.5实现4秒百万面、千万面级3D生成;抖音AI治理谣言,处置浏览下降62%;苹果Siri升级采用谷歌1.2万亿参数模型,本地运行成关键;支付宝完成3亿笔AI支付,发布Token Pay和AI钱包。

  • 35万起售!Caviar推出iPhone 17 Pro Max典藏版:机身可拆装瑞士名表

    高端数码定制品牌Caviar发布Masters of Time典藏系列,基于iPhone 17 Pro Max深度改装,首创机身内嵌可拆装瑞士机械腕表的定制方案。 产品核心搭载自研Watch Vault快拆锁仓结构,机身背部内置专用机械锁位,无需工具,旋转卡扣即可取出腕表、装配表带正常佩戴。 仓体内衬软性材质防磕碰,取下腕表后可换装星盘星盘仪雕花装饰盖板,机身完整美观,一物实现手机、腕表双形态使用

  • 弃购率超70%,Upsello携手飞诺门阵押注电商AI导购

    Upsello与飞诺门阵科技成立合资公司,将独立站聊天框从“客服入口”转型为“销售入口”。其AI智能导购能识别用户购买意图,结合商品、订单、优惠等数据,主动完成推荐、挽单、跟进等动作,而非仅回答问题。实测显示,该方案可使AOV提升10%-15%,弃单挽回率5%-15%,响应时间低于5秒,并支持50多种语言。Upsello旨在让客服中心成为第二增长引擎,把对话窗口变成新的交易入口。

  • 肯德基Skill正式接入千问:疯狂星期四一句话下单 直接到店取

    肯德基Skill接入千问App,全国1.3万门店可直接语音点单,如“帮我点附近肯德基的疯狂星期四”,系统自动匹配门店、套餐并显示距离和取餐时间。作为首个接入的餐饮品牌,肯德基与千问会员权益打通,下单自动使用大神卡和优惠券。千问近期宣布全面开放第三方Agent和Skill,瑞幸咖啡、蜜雪冰城、东方航空等首批企业已测试,将陆续上线。Agent具备记忆和主动规划能力,可提供行程提醒、权益到期提醒等服务。

  • ROG Xbox Ally X20 搭载谷粒GuliKit TMR 摇杆,双方合作进一步深化

    谷粒科技GuliKit宣布其TMR电磁摇杆技术已应用于ROG最新发布的Xbox Ally X20掌机,双方合作进一步深化。该技术采用非接触式电磁感应方案,解决了传统碳膜电位器摇杆的漂移问题,提升了稳定性和寿命。此前谷粒已为ROG提供官方授权维修替换模块,此次直接应用于整机核心部件,展现了其行业领先地位。谷粒持续研发电磁摇杆技术,并已为Steam Deck、Switch等多类掌机及游戏控制器提供元件供应和定制化解决方案,未来将继续推动游戏操控体验升级。

  • CallFay GEO & Studio 新品发布会圆满举行

    CallFay在深圳举办“三虾万物·AI共生”新品发布会,推出CallFay Studio和CallFay GEO两大产品,聚焦AI内容生产与搜索可信占位。来自腾讯云、阿里云、火山引擎等行业伙伴围绕AI技术趋势、电商经营变革等展开交流。CallFay致力于构建从“被搜索”到“被成交”的企业全域智能经营闭环,通过产品矩阵降低AI应用门槛,助力商家实现数字化增长。

今日大家都在搜的词: