首页 > 业界 > 关键词  > 视觉模型最新资讯  > 正文

轻量化MobileMamba视觉模型来了|浙大/腾讯优图/华中科大联合出品

2024-12-02 09:25 · 稿源: ​量子位公众号

浙大、腾讯优图、华中科技大学的团队,提出轻量化MobileMamba!既良好地平衡了效率与效果,推理速度远超现有基于Mamba的模型。一直以来,轻量化模型研究的主阵地都在CNN和Transformer的设计。但CNN的局部有效感受野在高分辨率输入时,难以获得长距离依赖;尽管Transformer有着全局建

......

本文由站长之家合作伙伴自媒体作者“​量子位公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 百度第一!百度智能云一见领跑视觉大模型赛道

    IDC最新报告显示,百度智能云凭借"文心一言4.5"多模态大模型和"文心X1"深度思考模型,在视觉大模型领域综合实力排名第一。其智能云平台在算法模型、工程化落地、行业覆盖等方面优势显著,已服务餐饮、钢铁、电力等20多个行业,帮助数百家企业实现生产全环节的数字化管理。典型案例包括:为风电集团构建安全管控系统,巡检效率提升6-10倍;与中钢研合作金相分析模型,检测准确率达95%;助力连锁餐饮实现全国1000+门店服务质量量化管理,订单覆盖率从5%提升至95%。通过"云端大模型+边缘小模型"的协同架构,在保障精度的同时大幅降低应用成本,推动专业级视觉AI应用普及。

  • 视觉中国2025半年报:AI创意定制业务同比增长超20%

    视觉中国发布2025年半年度报告,实现营收39.9亿元,归母净利润4.38亿元。公司聚焦AI技术研发与应用,AI创意定制业务同比增长超20%,成为新增长点。推出AI辅助创作功能,上线一站式创意生成平台,服务华为、荣耀等客户。音视频业务销售额占比超32%,签约AI创作者超9000名。持续加强版权保护,当选中国版权协会理事单位。未来将深化AI技术与版权数据融合,共建数字文化新生态。

  • 视觉中国战投企业创始人入选2025年《财富》中国40位40岁以下商界精英榜

    视觉中国战投企业像素绽放PixelBloom创始人赵充入选《财富》2025年“中国40位40岁以下商界精英”榜单。该公司2018年成立,2023年推出全球AI办公产品,实现“一句话生成PPT”功能,20个月获超2000万全球用户。视觉中国接入海量版权素材,确保内容专业合规。公司正孵化AI图表、音视频转录等产品,打造“AI办公全家桶”,今年完成B3轮融资,加速产品Agent化转型,积极布局国际市场,支持20种语言版本,与AMD、英特尔等合作优化算力方案,通过API接口构建全球化增长模式。

  • 从数据穿透到模型迭代,攀智资本:重新定义技术驱动投资

    攀智资本(香港)有限公司以技术驱动投资为核心,在全球金融市场调整与中国金融业蓬勃发展的背景下,通过AI与量化交易深度融合,构建高效数据分析、量化模型、智能风控和自动化交易系统。公司精准锚定中国市场机遇,布局多元资产,挖掘政策红利与技术创新带来的投资机会。未来将拓展ESG投资与全球化业务,持续完善量化基础设施,推动行业技术转型,展现技术驱动投资的新范式。

  • AI日报:智谱视觉推理模型GLM-4.5V开源;达摩院开源三项具身智能核心技术;360智脑推出Light-IF系列模型

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、智谱GLM-4.5V开源发布:全球100B级最佳视觉推理模型智谱宣布推出并开源了全球100B级效果最佳的开源视觉推理模型GLM-4.5V,这是该公司在通向通用人工智能(AGI)道路上的又一重要探

  • 第四代革新视觉体验!技嘉魔鹰Q280G WOLED显示器正式上市

    技嘉科技2025年8月18日发布旗舰电竞显示器魔鹰Q280G,搭载LG Display第四代WOLED Meta3.0面板。该27英寸专业显示器采用全新光源架构,峰值亮度达1500尼特(较上代提升50%),通过VESA DisplayHDR TrueBlack500认证,支持280Hz高刷与0.03ms响应,配备99.5% DCI-P3色域和原生1,500,000:1对比度。接口含双HDMI2.1、DP1.4及USB-C,支持KVM切换功能。首发优惠价2899元(原价3399元),前50名下单赠蓝牙音箱,8月18日晚8点正式开售。

  • 昆仑万维UniPic 2.0“小钢炮”模型炸场,一个模型搞定理解+生成+编辑

    大模型又迎来新一波的迭代周期。 近日,从Open AI发布GPT-5,到国内的昆仑万维、商汤、百川智能、智谱等都陆续发布了自己的新模型。其中昆仑万维更是一口气开启了技术周,连续5天每天发布一个新模型,而8月13日发布的,正是其本周发布的第三款模型——多模态统一模型UniPic2.0。 UniPic2.0主打的是,在单一模型中深度融合图像理解、文本到图像生成、图像编辑三大核心能力

  • AI日报:Wan 2.2-S2V模型即将发布;​字节跳动内测3D Model Generator;微软开源 VibeVoice-1.5B 模型

    本期AI日报聚焦多项技术突破:阿里通义万相发布Wan 2.2-S2V模型,实现视频音频同步生成;字节跳动研发3D模型生成工具,降低建模门槛;面壁智能推出MiniCPM-V4.5端侧多模态模型;苹果提出RLCF训练法提升模型性能;微软开源VibeVoice-1.5B支持超长语音合成;谷歌Imagen 4正式上线;英伟达发布Jetson Thor机器人计算平台;Genspark推出AI Designer一键生成品牌方案;豆包上线未成年人保护模式。

  • 降低创作门槛!爱诗科技新一代生成式大模型加速AI视频大众化

    爱诗科技8月27日发布新一代AI视频生成模型PixVerse V5,实现秒级高质量视频生成,支持360P至1080P分辨率。新模型在真实度、灵活性及生成速度上显著提升,覆盖人物、二次元、商业广告等多场景创作。同步上线Agent创作助手,降低使用门槛,用户无需专业技巧即可一键生成专业级视频。该技术推动AI视频从专业工具走向大众化应用,加速行业落地。

  • AI大模型费用计算器:新手如何不再为选择工具而头疼

    文章探讨了AI工具选择困境,推荐使用AIbase.cn导航站。该站通过分类筛选、标签过滤和对比功能,帮助用户快速找到合适工具,避免信息过载。强调技术应服务于人,好的工具应降低使用门槛,而非增加困惑。

今日大家都在搜的词: