首页 > 传媒 > 关键词  > 正文

明略科技研究成果被ACM MM 2025接收,攻克个性化注视点预测难题

2025-07-09 10:17 · 稿源: 站长之家用户

近日,明略科技与北京大学、吉林大学合作的最新研究成果《PRE-MAP: Personalized Reinforced Eye-tracking Multimodal LLM for High-Resolution Multi-Attribute Point Prediction》被ACM MM2025正式接收。该研究为解决现有视觉注意力模型在个性化注视点预测中的局限性,提出了一种新的方法(PRE-MAP)和一个大规模多模态数据集(SPA-ADV),以更好地捕捉个体差异并提高高分辨率视频中的多属性注视点预测精度。

ACM MM2025(ACM International Conference on Multimedia)计划将于2025年10月27—31日在爱尔兰都柏林举办。该会议由国际计算机学会(ACM)主办,是全球多媒体技术领域的旗舰会议,同时也是中国计算机学会(CCF)推荐的A类国际学术会议。

论文标题: PRE-MAP: Personalized Reinforced Eye-tracking Multimodal LLM for High-Resolution Multi-Attribute Point Prediction

(中文标题:PRE-MAP:用于高分辨率多属性注视点预测的个性化眼动追踪多模态大语言模型)

论文作者:吴寒冰*、姜平*、苏安炀*、赵晨旭、傅天宇、吴明辉、谭北平、李慧盈(*为共同第一作者)

研究成果简述:

1. 直击行业核心痛点

在当今的数字广告领域,理解消费者的目光焦点至关重要。然而,不同背景的观众(如年龄、性别各异)在观看同一视频广告时,其注意力分布也大相径庭,传统技术却无法捕捉这种个性化差异。传统的显著性预测模型通常采用分割方法,依赖于降采样的低分辨率图像来生成显著性热图,随后将其放大到原生分辨率,这限制了它们捕捉个性化注意力模式的能力。

2. 构建高质量数据底座

为攻克这一难题,研究团队开创性地建立了业界领先的大规模个性化注视行为数据集(SPA-ADV),首次记录了超过4500名不同年龄与性别背景用户的真实视觉行为。该数据集提供精确的个体级注视点坐标,为个性化显著性建模提供了高质量的基准数据支持。

3. 研发高精度预测模型

基于此数据集,团队研发了PRE-MAP创新AI预测模型。该模型能结合用户的个人特征,利用最前沿的多模态大模型技术,增强模型的泛化能力和个性化预测效果,精准预测出“某一类人会看哪里”。有效解决现有AI模型预测不准、难以聚焦个性化热点的问题,帮助品牌方和广告商更科学地优化广告创意、评估投放效果,实现真正的“精准触达”。

明略的多模态实践:从脑电到眼动,补齐广告预测模型的关键拼图

此次成果并非孤立的突破,而是明略科技在多模态领域长期且深度耕耘的必然结果,彰显了公司在前沿AI技术探索与大模型应用落地上的前瞻性布局:

早在2023年,明略科技率先成为国内首家基于多模态大语言模型(MLLM)实现智能社交媒体内容分析和策略生成的企业,首度将多模态大语言模型(MLLM)应用于识别并预测能带来最佳营销效果的多样化内容类型,开辟了广告领域全新的多模态技术应用赛道。

2024年,明略科技推出超图多模态大型语言模型(HMLLM),进一步整合了脑电等非标模态数据,支持企业对广告素材中的实体、情绪、效果、场景及受众等多样化元素进行深度分析,从而提升营销效果,生成预测效果良好的有效营销内容,并为企业视频广告提供多维度优化建议。超图多模态大型语言模型(HMLLM)的相关成果曾荣获ACM MM2024最佳论文提名。

今年6月,基于自研的超图多模态大型语言模型(HMLLM),协同混合专家(MoE)模型,明略科技再推创新成果——AI驱动的全球化广告测试及优化平台AdEff。该平台专为全球广告创意测量打造,可快速、准确预测消费者对广告的主观反应和广告效果,并给出优化建议。在测试效率大幅提升的同时,显著降低广告测试成本,让企业有机会对每一支广告进行测试,在 “创意感性” 与 “商业理性” 之间找到平衡。

直至7月本次研究成果被接收,标志着明略科技在多模态学习这一人工智能前沿方向取得了又一突破性进展,补齐了广告预测模型中“用户个性化视点追踪”这一关键拼图。它既是推动广告预测模型高质量发展的重要一环,也昭示着机器理解人类感知的精度即将迈上新的台阶。

在数字化内容日益碎片化的今天,AI驱动的科学预测已成为提升内容触达效率的关键引擎。明略科技在多模态学习领域的系统性实践,将在品效提升、成本优化和内容创新层面展现出广阔的应用价值。

立足于此,明略科技的视野不止于多模态领域的深耕。未来,公司将会面向更广阔的AI大模型及Agent技术领域持续探索,致力于把前沿科研成果转化为强大的产业动能,驱动广告营销乃至更多行业的智能化升级,为构建高效、智能的技术生态贡献力量。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 2025WAIC 聚焦:扫描全能王“无限扫描”技术破解文保数字化难题

    2025世界人工智能大会上,合众信息旗下扫描全能王展示了"无限扫描"技术,为文物数字化带来突破。该技术成功应用于南京博物院镇馆之宝《坤舆万国全图》的数字化,这幅1608年的地图是国内现存最早、最完整的中文世界地图。通过AI技术,解决了大尺寸文物拍摄不全、拼接困难、图像畸变等难题,只需简单拍摄视频即可生成高清数字图像。AI还能智能识别地图元素,实现"让文物说话"的数字化体验。该技术也适用于工程设计图纸等大尺寸文档的数字化保存,突破物理条件限制,为文化传承开启新篇章。(140字)

  • OpenAI CEO:GPT-6将具备个性化记忆 记住用户偏好习惯

    OpenAI的首席执行官萨姆奥尔特曼(Sam Altman)在近日的一次专访中,透露了下一代大模GPT-6的最新进展。他表示,GPT-6 的开发正在积极推进中,其发布节奏将比从GPT-4到GPT-5的周期更快。 奥尔特曼特别强调,GPT-6将不再局限于单纯回答问题,而是朝着与用户深度适配”的方向演进。他举例描述

  • 中科摇橹船登榜2025年《财富》中国科技50强

    8月21日,《财富》发布“2025年中国科技50强”榜单,聚焦“生于中国,影响世界”的创新力量。中科摇橹船作为重庆唯一代表企业入选,华为、腾讯等行业龙头持续引领产业发展。榜单显示超三分之一企业来自高端制造领域,标志我国科技产业正从模式创新向硬科技创新战略转型。中科摇橹船依托“光+AI”底层技术创新,在智能制造、民生安全等领域构建智能感知生态,其超远距激光雷达相机构建厘米级形变监测系统,突破水下成像技术极限。未来企业将深化人工智能与机器视觉融合,助力制造业转型升级,增强中国硬科技全球竞争力。

  • B站发布2025年Q2财报:AI内容成增长最快科技品类

    近日,哔哩哔哩(以下简称“B站”)公布了截至2025年6月30日的第二季度未经审计财务报告。数据显示,本季度B站总营收达73.4亿元人民币,同比增长20%,在整体市场环境中展现出强劲的增长态势。 从业务板块来看,各业务均呈现出积极的发展趋势。广告业务收入为24.5亿元,同比增长20%。游戏业务同样表现出色,收入达16.1亿元,同比增长60%。增值服务业务收入进一步提升至28.

  • 每日互动亮相2025可信数据空间推进大会

    8月21日,2025可信数据空间推进大会在京召开。每日互动首席数据官吕繁荣出席并发表演讲,系统阐释公司在可信数据空间领域的创新实践。其“发数站”平台入选标杆案例,通过“可信数据空间+可控大模型”技术组合,连接数据使用方、提供方和服务方,推动数据要素安全高效流通。目前该平台已在医疗、交通等30多个城市落地,助力数据价值释放与产业智能化升级。

  • 安全智能体引领防御变革 ISC.AI 2025论坛呈现多维度实践成果

    ISC.AI2025安全智能体技术论坛在北京召开,聚焦AI赋能网络安全新范式。论坛汇集专家与企业代表,围绕安全智能体的实战应用、技术架构及行业落地展开研讨。360集团提出安全智能体需具备感知、推理、决策等四大能力,并展示了终端防护、流量分析等场景的智能解决方案。专家指出,AI驱动的攻击防御已成趋势,需构建自动化、通用化的安全体系。论坛成果为数字时代安全防御体系的智能化升级提供了实践路径。

  • 2025上海品牌策划公司哪家好?

    上海市场竞争激烈,企业需选对品牌策划公司才能脱颖而出。市场上有众多风格各异的策划公司,如何挑选合适伙伴成为难题。奇正沐古、君智咨询等公司以独特战略方法帮助企业挖掘优势基因,构建品牌体系,实现差异化竞争。其中奇正沐古由孔繁任创立,服务范围广泛,已助力超300家企业实现品牌跃升。企业应根据自身需求选择:初创企业适合擅长从0到1构建品牌的公司;成熟企业则需侧重营销推广的公司。总之,企业需综合考虑,找到能携手共进的合作伙伴。

  • 《歌手2025》背后,伊利伏击蒙牛

    全网喧哗。 当《歌手2025》在陈楚生拿下歌王之后成功掀起舆论风暴,这档跌宕起伏的“年度大戏”终于落下帷幕。 相比去年石破天惊的直播One Take改造音综掀起全民浪潮,《歌手2025》依旧在相同模式之下以更残酷的赛制、每期都有淘汰让话题度拉满,“爆爆爆”背后是观众们各种情绪的叠加,而“做局”这一表达贯穿始终,无论是上场顺序、PK对象、歌曲选择、编曲反馈,�

  • 快手2025年Q2经调整净利润同比增长20.1% 首次宣布派发特别股息

    今日,快手发布2025年二季度业绩,总营收同比增长13.1%至350亿元,经调整净利润达56亿元,同比增长20.1%,超过市场一致预期。 其中线上营销服务、直播和其他服务(含电商及可灵)对收入的贡献占比分别为56.4%、28.7%和14.9%。

  • 2025快手超级夏晚定档:以亲密之名,赴夏日狂欢之约

    2025快手超级夏晚将于8月30日在成都举行,以“亲密关系”为主题,集结张震岳、谢娜、鞠婧祎等明星及快手创作者同台演出。晚会通过明星阵容、互动环节和特色社交玩法,打造沉浸式狂欢体验。线上线下联动设计增强参与感,让观众不仅是观看者更是参与者。快手与北京卫视共同播出,为年轻人带来难忘夏夜盛宴。

今日大家都在搜的词: