首页 > 业界 > 关键词  > 多模态语言模型最新资讯  > 正文

2B多模态新SOTA,华科、华南理工发布Mini-Monkey,专治“切分增大分辨率”后遗症

2024-08-13 08:52 · 稿源: 新智元公众号

【新智元导读】Mini-Monkey 是一个轻量级的多模态大型语言模型,通过采用多尺度自适应切分策略(MSAC)和尺度压缩机制(SCM),有效缓解了传统图像切分策略带来的锯齿效应,提升了模型在高分辨率图像处理和文档理解任务的性能。它在多项基准测试中取得了领先的成绩,证明了其在多模态

......

本文由站长之家合作伙伴自媒体作者“新智元公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • AI日报:阿里推多模态模型Qwen3-Omni;谷歌推出AP2协议;百度推出Qianfan-VL 模型

    本期AI日报聚焦多领域技术突破:阿里云推出全球首个全模态AI模型Qwen3-Omni,支持文本、图像、音频和视频统一处理;百度发布多尺寸视觉理解模型Qianfan-VL,优化企业级应用。苹果扩展Image Playground平台,引入ChatGPT等第三方模型。谷歌与PayPal合作推出AP2协议,推动AI支付安全创新。钉钉上线AI表格助手,支持自然语言生成表格。DeepSeek开源V3.1-Terminus模型,性能显著提升。Kimi推出Agent会员服务,智元机器人开源全球首个通用具身智能模型GO-1,降低技术门槛促进行业创新。

  • AI日报:腾讯重磅发布混元图像3.0;快手发布KAT系列Agentic Coding大模型;苹果悄然研发ChatGPT式应用

    快手发布KAT系列代码大模型,腾讯推出“混元图像3.0”实现多模态突破,苹果研发类ChatGPT应用升级Siri,谷歌更新Gemini 2.5 Flash Lite提升效率。苹果还推出Manzano图像模型,YouTube Music测试AI音乐主播功能,VideoFrom3D框架简化3D视频生成,Moondream 3.0在多项基准测试中超越GPT-5等顶尖模型,展现强大性能。

  • 既能读懂情绪,还能多模态交互!INDEMIND用空间智能重新定义陪伴机器人

    TCL与INDEMIND合作推出的陪伴机器人“Ai Me”通过空间智能技术实现突破,从传统2D感知升级为3D语义感知,赋予机器人动态语义建图、实时环境适应及多模态交互能力。该平台借助立体视觉与多传感器融合,让机器人精准构建三维地图,识别家居属性,实现主动避障与个性化服务。同时,结合低算力混合模型与情感交互功能,机器人可感知用户情绪、提供安全防护,并支持宠物看护等场景拓展,从“工具”升级为有温度的“家庭伙伴”,真正满足复杂家庭需求。

  • 小度发布多模态智能摄像机,AI大模型重塑家庭看护体验

    小度科技推出首款多模态智能摄像机C800,搭载800万像素4K超清摄像头,支持AI大模型技术。该产品不仅能实现高清监控,还具备智能行为识别、语音交互等功能,可自定义看护提醒。结合视觉与语音交互,支持复杂语义查询和家庭设备联动,扩展智能家居应用场景。目前产品已全网发售,年底还将推出三摄版本,持续探索AI硬件创新。

  • 超越RGB的全局高色域有多狠?2025最值得期待的电视技术还得看SQD-Mini LED

    TCL最新发布的SQD-Mini LED技术突破行业十年色域瓶颈,实现100% BT.2020全局高色域,结合超级量子点与超强控光技术,解决了传统RGB-Mini LED色彩纯度不足、串色等问题。搭载该技术的X11L电视以万象分区精准控光提升对比度,色彩还原精准、过渡自然,树立了"光色双绝"新标杆,推动高端电视画质进入新纪元。

  • 突破 Mini LED!三星 Micro RGB 引航显示进入 Micro 时代

    三星在京东方MALL举办“AI的呵护”家电线下体验展,展出全球首款Micro RGB电视115MR95F。该电视采用Micro RGB技术,实现100% BT.2020色域覆盖,色彩精准度与对比度达到新高度。搭载AI芯片优化画质,支持144Hz刷新率与杜比全景声,定价199,999元。三星借此布局超高端市场,展示Micro RGB+QD-OLED+Micro LED三大技术矩阵,重塑显示行业格局。

  • 央视深度揭秘:最值得买的RGB-Mini LED电视海信U7S Pro,硬实力来自中国芯

    海信发布RGB-Mini LED电视U7S Pro,采用RGB三原色背光技术,无需荧光粉二次转换,实现更高色彩纯度和亮度,画面通透真实。搭载自研信芯AI画质芯片H7,支持行业最高3×10240分区控制,结合黑曜屏Ultra双层降反技术,反光率仅1.28%。具备4K 170Hz高刷,游戏体验流畅。新品预售价15999元起,预存1000元抵2000元,享能效补贴。

  • 破解海外旅游语言困境,时空壶新T1以端侧模型开启全球畅行

    国庆假期临近,海外旅游热度攀升,语言沟通成为游客面临的主要障碍。网络不稳定更使依赖在线翻译工具的旅行者陷入困境。时空壶新T1翻译机通过端侧AI模型,实现无网或弱网环境下的流畅翻译,支持31种语言互译,覆盖全球98%主流旅游地。其离线翻译准确率达90%,响应迅速,并具备拍照翻译和降噪功能,有效解决机场、餐厅等嘈杂场所的沟通难题。新T1助力游客跨越语言壁垒,尽享无忧旅程,真正实现“无网也能畅行全球”。

  • TCL华星助力产业规范,《Mini LED室内商用显示屏》团体标准重磅发布

    2025年7月15日,《Mini LED室内商用显示屏》团体标准正式发布,标志着Mini LED技术从分散发展迈向统一规范的关键跨越。该标准由深圳照明与显示工程行业协会等机构牵头,汇聚近50家产业链企业智慧,构建了科学、系统的质量评估与性能规范体系。通过明确产品定义、分类维度、性能指标升级及检测方法,重点解决行业长期存在的技术指标不统一、质量参差不齐等痛点。标准实施将推动产业链协同,预计带动市场规模年增速超30%,助力企业提升高端产品竞争力,并为客户采购提供清晰依据,促进Mini LED在会议大屏、数字标牌等商用场景加速落地,引领产业向更高一致性、更低功耗演进。

  • iPhone 17 Pro mini首曝:4.7英寸屏 未能上市

    9月24日有博主爆料,苹果曾计划推出4.7英寸iPhone 17 Pro mini,但在DVT阶段取消开发。该机型设计类似iPhone 17 Pro,采用横向矩阵相机和铝合金一体化机身,但工程师认为其外观“荒谬”。苹果曾尝试小屏路线,iPhone 12/13系列推出mini版本但销量未达预期,iPhone 14起以Plus替代mini,然而Plus销量同样不佳。从iPhone 17系列开始,苹果新增主打轻薄的Air机型,Plus系列正式退出市场。

今日大家都在搜的词: