首页 > 传媒 > 关键词  > 正文

明略科技研究成果被ACM MM 2025接收,攻克个性化注视点预测难题

2025-07-09 10:17 · 稿源: 站长之家用户

近日,明略科技与北京大学、吉林大学合作的最新研究成果《PRE-MAP: Personalized Reinforced Eye-tracking Multimodal LLM for High-Resolution Multi-Attribute Point Prediction》被ACM MM2025正式接收。该研究为解决现有视觉注意力模型在个性化注视点预测中的局限性,提出了一种新的方法(PRE-MAP)和一个大规模多模态数据集(SPA-ADV),以更好地捕捉个体差异并提高高分辨率视频中的多属性注视点预测精度。

ACM MM2025(ACM International Conference on Multimedia)计划将于2025年10月27—31日在爱尔兰都柏林举办。该会议由国际计算机学会(ACM)主办,是全球多媒体技术领域的旗舰会议,同时也是中国计算机学会(CCF)推荐的A类国际学术会议。

论文标题: PRE-MAP: Personalized Reinforced Eye-tracking Multimodal LLM for High-Resolution Multi-Attribute Point Prediction

(中文标题:PRE-MAP:用于高分辨率多属性注视点预测的个性化眼动追踪多模态大语言模型)

论文作者:吴寒冰*、姜平*、苏安炀*、赵晨旭、傅天宇、吴明辉、谭北平、李慧盈(*为共同第一作者)

研究成果简述:

1. 直击行业核心痛点

在当今的数字广告领域,理解消费者的目光焦点至关重要。然而,不同背景的观众(如年龄、性别各异)在观看同一视频广告时,其注意力分布也大相径庭,传统技术却无法捕捉这种个性化差异。传统的显著性预测模型通常采用分割方法,依赖于降采样的低分辨率图像来生成显著性热图,随后将其放大到原生分辨率,这限制了它们捕捉个性化注意力模式的能力。

2. 构建高质量数据底座

为攻克这一难题,研究团队开创性地建立了业界领先的大规模个性化注视行为数据集(SPA-ADV),首次记录了超过4500名不同年龄与性别背景用户的真实视觉行为。该数据集提供精确的个体级注视点坐标,为个性化显著性建模提供了高质量的基准数据支持。

3. 研发高精度预测模型

基于此数据集,团队研发了PRE-MAP创新AI预测模型。该模型能结合用户的个人特征,利用最前沿的多模态大模型技术,增强模型的泛化能力和个性化预测效果,精准预测出“某一类人会看哪里”。有效解决现有AI模型预测不准、难以聚焦个性化热点的问题,帮助品牌方和广告商更科学地优化广告创意、评估投放效果,实现真正的“精准触达”。

明略的多模态实践:从脑电到眼动,补齐广告预测模型的关键拼图

此次成果并非孤立的突破,而是明略科技在多模态领域长期且深度耕耘的必然结果,彰显了公司在前沿AI技术探索与大模型应用落地上的前瞻性布局:

早在2023年,明略科技率先成为国内首家基于多模态大语言模型(MLLM)实现智能社交媒体内容分析和策略生成的企业,首度将多模态大语言模型(MLLM)应用于识别并预测能带来最佳营销效果的多样化内容类型,开辟了广告领域全新的多模态技术应用赛道。

2024年,明略科技推出超图多模态大型语言模型(HMLLM),进一步整合了脑电等非标模态数据,支持企业对广告素材中的实体、情绪、效果、场景及受众等多样化元素进行深度分析,从而提升营销效果,生成预测效果良好的有效营销内容,并为企业视频广告提供多维度优化建议。超图多模态大型语言模型(HMLLM)的相关成果曾荣获ACM MM2024最佳论文提名。

今年6月,基于自研的超图多模态大型语言模型(HMLLM),协同混合专家(MoE)模型,明略科技再推创新成果——AI驱动的全球化广告测试及优化平台AdEff。该平台专为全球广告创意测量打造,可快速、准确预测消费者对广告的主观反应和广告效果,并给出优化建议。在测试效率大幅提升的同时,显著降低广告测试成本,让企业有机会对每一支广告进行测试,在 “创意感性” 与 “商业理性” 之间找到平衡。

直至7月本次研究成果被接收,标志着明略科技在多模态学习这一人工智能前沿方向取得了又一突破性进展,补齐了广告预测模型中“用户个性化视点追踪”这一关键拼图。它既是推动广告预测模型高质量发展的重要一环,也昭示着机器理解人类感知的精度即将迈上新的台阶。

在数字化内容日益碎片化的今天,AI驱动的科学预测已成为提升内容触达效率的关键引擎。明略科技在多模态学习领域的系统性实践,将在品效提升、成本优化和内容创新层面展现出广阔的应用价值。

立足于此,明略科技的视野不止于多模态领域的深耕。未来,公司将会面向更广阔的AI大模型及Agent技术领域持续探索,致力于把前沿科研成果转化为强大的产业动能,驱动广告营销乃至更多行业的智能化升级,为构建高效、智能的技术生态贡献力量。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 金蝶征信“金融风控大模型” 摘得AFAC2025大奖

    一家社区水果店凭借收款码的36个月交易记录,将银行贷款额度从7万元提升至10万元。这揭示了中国超3亿商户正通过二维码流水数据构建数字信用体系:使用收款码满六个月的商户获贷可能性超60%,三年后跃升至90%。此类高频实时数据正重塑风控逻辑——不看抵押、不看报表,只忠实记录每笔交易背后的经营事实。金蝶征信凭借AI与知识图谱技术,穿透至6层交易链条,构建包含4.45亿交易关系的产业互联网图谱,助力金融机构实现精准信贷匹配。其智能风控系统已推动合作机构放贷额度提升50%,标志着风控模式从“经验驱动”向“数据智能驱动”的转型。

  • 2025 VDC游戏技术分会召开,多维技术创新定义游戏新体验

    2025年vivo开发者大会于10月10日在深圳召开,游戏技术分会以“极致·共生”为主题,展示了vivo在游戏领域的最新技术成果与合作案例。大会聚焦移动游戏技术爆发新阶段,强调通过软硬件协同实现性能、触控、图形等关键技术突破,为玩家带来多维一体的极致体验。vivo推出自研电竞芯片Q3及图形SDK,支持超分、超帧与光线追踪技术,并与《王者荣耀》《无限暖暖》等游戏深度合作,优化帧率、触控响应及功耗表现。未来vivo将持续夯实技术底座,通过VGS平台携手开发者共建游戏生态,推动移动游戏产业体验升级。

  • 半年营收近20亿,2025年了,还有社交公司要上市?

    「米连科技」,可能会有些陌生,但提到「伊对」,想必读者就很熟悉了。 公司成立于2015年,定位为在线情感社交平台,旗下产品包括面向国内市场的「伊对」(恋爱社交平台)、「贴贴」(语音社交平台),和以海外市场为主的「HiFami」(从应用截图来看,类似「贴贴」海外版)、「Chatta」(视频社交平台)、「Seeta」(视

  • AI定制美颜的背后,天玑9500强大端侧AI赋能vivo X300个性化体验

    vivo X300系列旗舰手机正式发布,搭载天玑9500芯片,以“蔡司2亿影像双王”新格局开启移动影像新征程。MediaTek与vivo深度合作,从联合调校走向共同定义,实现性能与能效的卓越平衡。天玑9500采用第三代全大核架构,CPU性能提升显著,功耗大幅降低,结合双NPU设计,带来AI影像增强、4K视频录制及流畅系统体验,树立高端手机新标杆。

  • 决战东方之巅!AGON爱攻迅猛龙CS24A以巅峰性能助力CAC 2025战火点燃

    完美世界电竞主办的CAC2025反恐精英亚洲邀请赛将于10月14日在上海举行,赛事升级为亚洲CS领域最高规格竞技殿堂,汇聚全球五大赛区16支顶尖战队角逐百万美元冠军奖金。AGON爱攻作为官方合作伙伴,推出专为CS打造的迅猛龙联名定制显示器CS24A,凭借610Hz超高刷新率与0.3ms极速响应等专业配置,助力选手稳定发挥。本届赛事还将通过“完美电竞合作伙伴联盟”构建完整电竞生态闭环,为亚洲巅峰对决提供坚实硬件支持。

  • 2025 PMI项目管理大会|多个活动板块首发,早鸟报名通道开启

    自2008年起,PMI项目管理大会汇聚数百位国内外顶尖企业代表、行业领袖与专家,分享洞见与实践,启发数十万参与者。当前,生成式AI、大数据等前沿科技正重塑商业生态与项目管理模式。2025年大会以“智驱万象,项启新篇”为主题,聚焦科技带来的颠覆性变革与机遇,通过行业趋势、跨界交流等多维度活动,打造最具影响力的共创平台,推动合作突破边界。报名已开启,微信搜索“2025PMI项目管理大会”即可参与。

  • 「可能世界」2025 砂之盒沉浸展盛大开幕

    10月15日,2025砂之盒沉浸展(SIF2025)在北京开幕。本届展会以“可能世界”为主题,汇集全球38部顶尖VR/AR作品,设置未来叙事峰会、未来娱乐展映等五大板块。活动聚焦沉浸式内容创作与产业发展,探讨新技术如何重塑娱乐体验与商业模式。佳能、PICO等行业伙伴展示了前沿拍摄设备与解决方案,推动沉浸式影像从内容生产到商业落地的创新探索。

  • 2025第十五届贵阳汽车文化,10月23-26日盛大启幕

    2025年第十五届贵阳汽车文化节将于10月23-26日在贵阳国际会议展览中心举办。本届车展推出10余项特色活动,包括国补省补双重购车补贴政策(新能源车最高补贴2万元、燃油车最高1.5万元)、尚格30周年经典老车特展、改装车嘉年华、咖啡主题市集、RC模型车漂移秀、汽车主播挑战赛等。现场还将设置亲子积木乐园、萌宠互动区及打卡抽奖活动,打造集购车、文化体验与娱乐互动于一体的年度汽车盛宴。

  • 生成式引擎优化(GEO)是什么?2025 年最值得关注的内容流量新入口

    2025年,用户正从点击链接转向直接向AI提问,生成式引擎优化(GEO)成为流量新入口。GEO旨在让AI在回答时主动推荐品牌,不同于传统SEO的关键词排名。企业需确保内容被AI准确理解并引用,否则将在用户认知中“消失”。领先者已通过批量生成AI友好内容抢占曝光先机。建议结合SEO与GEO双引擎驱动增长,并利用工具监测品牌在AI回答中的可见度。

  • 2025 国内 LIMS 厂商怎么选?

    本文对比金现代与三维天地两家LIMS厂商的核心竞争力差异。金现代采用低代码轻量化架构,20天快速部署,适配中小实验室基础需求,主打标准化服务与低成本方案;三维天地采用重型全域集成架构,支持多基地协同与深度定制,服务电子制造、白酒等行业。建议中小企业选金现代实现快速落地,大型跨地域企业选三维天地满足复杂需求。未来二者技术边界或趋模糊,但场景化竞争优势仍将延续。

今日大家都在搜的词: