首页 > 业界 > 关键词  > 多图像场景最新资讯  > 正文

多图场景用DPO对齐,上海AI实验室等提出新方法,无需人工标注

2024-11-02 09:05 · 稿源: 量子位公众号

多图像场景也能用DPO方法来对齐了!由上海交大、上海AI实验室、港中文等带来最新成果MIA-DPO。这是一个面向大型视觉语言模型的多图像增强的偏好对齐方法。通过将单图像数据扩展至多图像数据,并设计序列、网格拼贴和图中图三种数据格式,MIA-DPO大幅降低了数据收集和标注成本,且具

......

本文由站长之家合作伙伴自媒体作者“量子位公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • AI日报:视觉中国与多家大模型公司达成合作;OpenAI紧急暂停Sora生成已故名人;谷歌推出Gemini地图数据集成工具

    视觉中国与多家AI公司合作开发可商用视觉大模型,已获阿里、微软等订单。OpenAI因不当内容暂停Sora生成马丁·路德·金形象视频,引发AI伦理讨论。DeepSeek在加密货币交易实验中表现领先。WhatsApp将禁止第三方通用AI聊天机器人,仅保留Meta AI。宇树科技推出仿人机器人Unitree H2,具备拟人化设计。谷歌为Gemini集成地图数据工具,可访问25亿地点实时信息。Opera推出集成三款AI助手的Neon浏览器,但用户体验存在困惑。Facebook在美加推出AI照片编辑建议功能,可分析手机未分享照片。

  • 卖家精灵《2025中国跨境电商+产业带地图数据报告》重磅首发(附下载)

    《2025中国跨境电商+产业带数据报告》正式发布,全面覆盖全国22省、5自治区、4直辖市及300多个地级市产业带。报告系统呈现全国产业带分布、优势与跨境机遇,包含成功出海案例、趋势分析及政策解读。通过"产业带地图"帮助卖家精准匹配货源,工厂高效对接全球市场。结合AI技术实现智能选品、市场分析及运营优化,助力跨境电商与产业带深度融合,推动行业从"拼运气"转向"拼数据、拼供应链"的高质量发展。

  • AI日报:微软发布首款自研图像生成模型 MAI-Image-1;百度世界大会时间公布;AI大牛开源nanochat教学工具

    微软发布首款自研图像生成模型MAI-Image-1,跻身LMArena前十,注重实用性与光影效果;百度世界2025大会将聚焦大模型与AI全球化战略;Meta新技术使RAG推理速度提升30倍;开源项目nanochat实现低成本构建聊天AI;谷歌NotebookLM新增动漫视频生成功能;中国农大发布神农大模型3.0助力智慧农业;腾讯启动"青云奖学金"培养AI人才;苹果FS-DFM模型长文本生成效率提升128倍;谷歌Lens整合AI图像编辑功能;港大与美团提出CodePlot-CoT方法,通过代码绘图解决数学难题,性能提升21%。

  • 葡萄酒进口数据:澳洲领跑,解码澳洲红酒黄金版图

    澳大利亚葡萄酒产业凭借独特风土条件、丰富品种和卓越品质,已成为全球市场重要力量。文章聚焦巴罗萨谷和石灰岩海岸两大经典产区,分析其地理特征、气候土壤及代表品种,并解读奔富和金锤酒庄的酿造哲学。数据显示,2025年澳洲葡萄酒出口额达248亿澳元,中国市场需求激增123%。产业正向品质驱动转型,两大酒庄通过技术创新与精准营销持续引领市场。

  • 腾讯混元图像3.0登顶LMArena榜一

    腾讯混元图像3.0模型发布仅一周,即在全球26个顶尖大模型中脱颖而出,登顶LMArena权威榜单首位,成为AI生图领域新王者。其成功得益于三大核心优势:能运用知识推理生成有逻辑内涵的图像;精准实现中英文长文本及细节标注的渲染;兼具真实质感与审美把控。作为开源模型,混元系列已构建覆盖多模态的技术生态,社区衍生模型超3000个,其中混元3D模型下载量超260万次,是全球最受欢迎的3D开源模型。未来腾讯将持续拓展其应用边界。

  • 聚焦 AI 时代机遇:视觉中国以优质数据与创新服务赋能企业发展

    近年来AIGC技术崛起冲击传统视觉内容行业。视觉中国敏锐把握AI机遇,在保持主营业务稳健的同时,积极布局AI领域,确立“AI智能+内容数据+应用场景”战略规划。依托超7亿条覆盖图片、音视频、3D模型的多模态基础数据集,启动数据结构化升级工程,通过“AI预标注+人工精校”提升数据价值。作为领先的多模态数据授权商,构建了覆盖数据采集、标注、审核、认证及授权的全链路服务方案,并创新推出“价值贡献度”数据收益分成模式,加速向AI数据服务商转型。

  • 从方法论到实践:阅文IP工业化,《诡秘之主》再进击

    隐隐若现的神秘古宅,塔罗牌、马车、蒸汽机、钟楼、墓园依次闪过,浓郁的维多利亚风情扑面而来;猩红血月穿透浓雾,低音铜管缓缓奏响,心跳节拍不自觉加快,氛围瞬间拉满;魔药、神祗、邪神各股势力粉墨登场,求生本能、思乡之情和“愚者”的使命感在内心暗暗角力…… “开篇就是高能名场面”、“恭迎愚者”、“太还原了,这就是我梦中的世界”——作为“诡秘IP�

  • 从“选配内卷”到“标配破局”,元戎启行凭交付数据突围

    2025年辅助驾驶赛道核心看点已从技术落地转向规模化交付。元戎启行表现亮眼:累计交付超13万辆,9月单月突破3万辆,成为继华为后第三家实现“单月3万+全系标配城市NOA”的供应商。其成功源于与魏牌高山、蓝山及吉利银河M9等爆款车型的深度合作,通过“标配智驾”打造差异化优势。元戎专注“单车规模化交付”策略,避免多车型分散资源,以用户体验驱动行业价值重构,标志着第三方供应商正以交付能力重塑竞争格局。

  • 4399元 一图读懂OPPO Find X9 刘作虎:严重超标的标准版

    10月16日,OPPO Find X9正式发布,售价4399元。该机采用创新绒砂工艺,实现玻璃绒感金属光泽与镜头模组无缝衔接,配备1.15mm极窄四等边直屏,整机1:1平衡分布,支持IP66/68/69满级防水及SGS五星抗跌耐摔认证。影像方面首发哈苏8K超清照片,默认直出高画质超清照,放大依然清晰;全球首推4K超清实况照片,覆盖所有焦段,解决行业十年画质难题。核心配置搭载联发科天玑9500平台、7025mAh电池、80W有线与50W无线充电,后置三摄均5000万像素。OPPO称其虽为标准版,却是全面革新的新基线,体验越级领跑行业。

  • 守护用户数据安全,OPPO 携火山引擎发布《移动 Agent 安全技术白皮书》

    在OPPO开发者大会上,OPPO联合火山引擎等机构发布《移动Agent安全技术白皮书》,宣布打造隐私计算云系统,通过端云协同架构构建用户数据全生命周期的“安全长城”。该系统结合火山引擎AI机密计算方案,实现端到端加密,确保数据“可用不可见”,任何人与系统均无法获取用户数据。双方将持续深化合作,致力于AI时代的数据安全治理,让用户享受AI便利的同时更安全放心。

今日大家都在搜的词: