首页 > 业界 > 关键词  > 正文

AI自学超越人工标注训练,蚂蚁数科2篇自监督学习论文入选国际顶会

2024-07-11 15:11 · 稿源:站长之家

近日,蚂蚁数科2项研究成果分别入选“欧洲计算机视觉会议(ECCV)”和“国际机器学习大会(ICML)”,可实现无需人工打标数据的情况下,通过自监督学习、强化学习等方法训练模型输出可信结果。据悉,两项成果将被应用于视频版权保护和智能问答领域。作为人工智能领域的顶级国际学术会议,2024年ECCV、ICML的论文接收率分别为27.5%、27.9%。

入选2024年欧洲计算机视觉会议(ECCV)的论文《基于区域令牌表征的自监督视频抄袭定位》核心解决版权保护场景的行业难题——视频抄袭定位,即判断两个视频中是否存在抄袭片段,并确定对应的起止时间。当前常用的抄袭片段定位算法依赖大量的人工标注数据训练模型。受视频时间长、比对工作量大等因素影响,人工标注的成本极高。蚂蚁数科AI团队提出了一个自监督学习的框架,通过算法自动生成丰富的训练样本,对特征模型、定位模型进行训练,实验结果表明,该⽅法无需使⽤任何⼈⼯标注数据,即可超越当前最先进的标注数据训练⽅法。同时,论文还创新性地在视觉Transformer模型(ViT)上增加了一种区域令牌(Regional Token)结构,使得模型可以关注到“画中画”等局部区域,增强抄袭识别的准确率和完整性。蚂蚁数科早在2019年就开始探索AI技术在版权保护领域的落地应用,这是团队研究成果第五次入选国际顶会。

_x0000_i1025

图说:国际顶级会议ECCV2024

此外,在智能对话领域的研究成果也取得突破性进展。今年5月入选2024年国际机器学习大会(ICML)的论文《基于强化学习的检索增强大语言模型可信对齐》由中国科技大学、合肥综合性国家科学中心人工智能研究所、蚂蚁数科联合申报。论文针对大语言模型容易遭受幻觉困扰、制造无效内容的问题,提出了基于强化学习的“可信对齐”策略,该策略的目标不只是“满足用户偏好”,而希望激励模型生成更可信的内容。相比传统基于专家标注样本的监督训练方式,“可信对齐”训练的模型更注重基于给定的上下文和逻辑给出可信的判断。实验结果表明,该方案比开源基础模型的准确率提升55%,与准确答案的对齐成本降低83%。此外,“可信对齐”在生成文字的流畅度方面比传统方法提升30%,良好的性能将有利于语言模型在TO B严谨行业的应用落地。

_x0000_i1026

图说:国际顶级会议ICML2024

自监督学习被认为是机器智能达到人类水平的关键,其最大的特点是不依赖人工标注的数据标签,可自主观察和学习、提取有用的特征,并应用于各种任务,与人类学习的方式相似。自监督学习在为模型训练降本提效的同时,具备更好的知识泛化能力和持续学习能力,研究对推动AI发展有着深远意义。

举报

  • 相关推荐
  • WPS AI 入选2025 AI原生应用创新案例」,重塑AI办公范式

    随着AI原生时代的加速到来,AI原生应用也迎来爆发式增长,并逐渐成为各场景应用体验的核心要素。

  • 阿里国际要靠AI破局

    走过前两年的低价厮杀与托管模式混战后,在当前全球贸易大变局下,跨境电商行业风云变幻。要在未来的不确定性中,寻找增长的确定性,作为阿里旗下聚焦海外电商的业务板块,阿里国际数字商业集团正在持续押注AI,希望助力商家走出“低价”竞争的漩涡,向“高附加值”转型。AI将带来一场外贸革命,在全球贸易局势的动荡中,马云口中的“AI电商”时代或许会加速到来,全球电商市场的竞争格局也将再次被改写。

  • 讲真训练营:领航全民终身学习新纪元,匠心打造个性化成长蓝图

    讲真训练营凭借独特课程设计和雄厚师资力量,在短视频创作与记忆提升两大热门领域打造了系统化课程体系。其课程从基础剪辑到高阶叙事策略全覆盖,并融合心理学、神经科学前沿成果开发科学训练方法。采用PBL项目式学习理念和ADDIE课程研发模型,通过直播授课、实操演练、社群互动等多元教学方式,构建了"理论+实践"一体化学习生态。平台汇聚各领域专家讲师,建立完善学员社群,持续探索个性化在线教育新模式,助力学员实现终身学习成长。

  • 联蔚数科端到端AI实践|“乐高式”组合,精准解决75%业务痛点

    联蔚数字科技在CDIE2025峰会上展示AI赋能零售快消行业的创新实践。通过"端到端"数字化闭环服务理念,将AI能力融入企业数字化全流程,从门店导购、培训到社交营销实现全方位赋能。重点推出三大解决方案:1)门店导购AI助手,实现售前、售中、售后全流程自动化,表单识别准确率达92%,人工确认效率提升60%;2)AI+培训系统,整合品牌知识库,通过智能测评和定制课程将产品考核周期从14天缩短至3天;3)KOS社交营销系统,结合AI技术实现内容精准管控,帮助品牌获取高质量用户。在电商领域,联蔚与抖音合作开发AI选品工具,通过商品洞察和价格弹性模型实现爆品预测,将分析周期缩短至2小时。底层构建大模型即用解决方案,支持企业快速部署专属AI能力。目前已在多个行业头部客户成功落地,助力企业实现业务提效和运营升级。

  • 卓世科技入选2025全国企业“人工智能+”行动创新案例TOP10

    AI赋能数字转型卓世科技以"智能体生态"重塑生产力边界2025年4月8日,《互联网周刊》联合eNet研究院、德本咨询正式公布"2025全国企业人工智能行动创新案例TOP100"榜单,卓世科技凭借"Agent开发平台与智能体数字员工"解决方案成功入选,高居榜单第七位。该案例以零代码编排、多智能体协作及私有化部署为核心突破,为北京集智未来人工智能产业创新基地构建了全场景数字化转型底座,成为AI技术落地实体经济的标杆范式。评审委员会评价称:"该案例不仅解决了当下效率痛点,更以生态化思维为AI技术的持续迭代提供了方法论。

  • 蚂蚁集团专项招募全球顶尖AI人才 推“Plan A”AI人才专项计划

    蚂蚁集团近日启动"Plan A"AI人才专项计划,面向全球顶尖高校招募人工智能领域的研究人才。该计划作为"蚂蚁星"校园人才项目的重要组成部分,旨在吸引优秀研究人员参与通用人工智能(AGI)的技术探索。蚂蚁集团CTO何征宇表示,公司将全力投入AGI技术研发,推动人工智能技术的普惠应用。该计划主要面向计算机、人工智能、网络安全、数学等理工科专业的硕士及博士毕业生,要求申请者毕业时间不早于2025年11月。入选人才将获得具有竞争力的薪资待遇和科研条件。

  • 猿辅导开启“教育+AI”新纪元,小猿AI三大产品重塑学习全场景体验

    4月15日,猿辅导集团发布教育行业首个AI范式"小猿AI",推出覆盖家校场景的三大战略级产品。该AI系统基于十年教育数据沉淀,构建四层技术架构:动态学情数据库、自研大模型矩阵和个性化学习方案。核心产品包括:1)小猿AI App,首创"五重错因分析系统",学习效率提升40%;2)小猿AI学习机,搭载13英寸护眼屏和智能基座;3)飞象人工智能通识课,国内首套K12全学段AI课程。创新亮点包括知识导航系统精准度达91%、情感计算引擎识别8类情绪状态。集团宣布实施普惠计划,基础功能向全国中小学生免费开放。此次发布标志着我国教育智能化进入新阶段,通过"技术+内容+终端"立体化布局,重新定义因材施教内涵。

  • 高考考上985的AI来了!超强数理推理横扫真题,训练秘籍剑指AGI

    全球首个工业界多模态推理模型Skywork-R1V升级至2.0版本,全面开源38B参数模型权重。该模型在高考物理、生物等学科题目上展现出强大的图文推理能力,准确率媲美985考生水平。技术突破包括:1)首创视觉奖励模型Skywork-VL Reward,在视觉和文本奖励基准测试中均获SOTA;2)引入混合偏好优化(MPO)机制,平衡推理深度与通用能力;3)采用选择性样本缓冲(SSB)技术解决训练中的优势�

  • 星纪魅族发布智能眼镜线下支付功能 与蚂蚁国际达成合作

    星纪魅族集团近日在香港宣布,其StarV+Air2智能眼镜将成为全球首款支持线下支付的AR设备。该产品通过语音确认即可完成支付操作,无需使用手机,实现了AR技术与支付场景的深度融合。这项创新功能由星纪魅族与蚂蚁国际旗下Alipay+跨境支付科技团队共同研发,预计今年第三季度正式上线。StarV+Air2智能眼镜重44克,采用光波导显示方案,支持2000nit高亮度显示,具备实时翻译、AR导航等实用功能,售价2799元起。

  • 聚智2025,AI重塑未来格局——2025人工智能论坛圆满落幕

    这场行业盛会云集了 200 余位国内外顶尖学者、行业领军人物,以大模型创新、人工智能前沿应用、AI哲学与伦理、数学科学交叉融合等热门议题为核心,展开多轮深度研讨与思维碰撞。论坛通过线上线下联动的形式,吸引了超千名专业人士及爱好者参与,为全球人工智能领域奉献了一场兼具学术深度与实践价值的思想盛宴,成为年度行业发展趋势的重要风向标。