首页 > 业界 > 关键词  > 正文

AI自学超越人工标注训练,蚂蚁数科2篇自监督学习论文入选国际顶会

2024-07-11 15:11 · 稿源:站长之家

近日,蚂蚁数科2项研究成果分别入选“欧洲计算机视觉会议(ECCV)”和“国际机器学习大会(ICML)”,可实现无需人工打标数据的情况下,通过自监督学习、强化学习等方法训练模型输出可信结果。据悉,两项成果将被应用于视频版权保护和智能问答领域。作为人工智能领域的顶级国际学术会议,2024年ECCV、ICML的论文接收率分别为27.5%、27.9%。

入选2024年欧洲计算机视觉会议(ECCV)的论文《基于区域令牌表征的自监督视频抄袭定位》核心解决版权保护场景的行业难题——视频抄袭定位,即判断两个视频中是否存在抄袭片段,并确定对应的起止时间。当前常用的抄袭片段定位算法依赖大量的人工标注数据训练模型。受视频时间长、比对工作量大等因素影响,人工标注的成本极高。蚂蚁数科AI团队提出了一个自监督学习的框架,通过算法自动生成丰富的训练样本,对特征模型、定位模型进行训练,实验结果表明,该⽅法无需使⽤任何⼈⼯标注数据,即可超越当前最先进的标注数据训练⽅法。同时,论文还创新性地在视觉Transformer模型(ViT)上增加了一种区域令牌(Regional Token)结构,使得模型可以关注到“画中画”等局部区域,增强抄袭识别的准确率和完整性。蚂蚁数科早在2019年就开始探索AI技术在版权保护领域的落地应用,这是团队研究成果第五次入选国际顶会。

_x0000_i1025

图说:国际顶级会议ECCV2024

此外,在智能对话领域的研究成果也取得突破性进展。今年5月入选2024年国际机器学习大会(ICML)的论文《基于强化学习的检索增强大语言模型可信对齐》由中国科技大学、合肥综合性国家科学中心人工智能研究所、蚂蚁数科联合申报。论文针对大语言模型容易遭受幻觉困扰、制造无效内容的问题,提出了基于强化学习的“可信对齐”策略,该策略的目标不只是“满足用户偏好”,而希望激励模型生成更可信的内容。相比传统基于专家标注样本的监督训练方式,“可信对齐”训练的模型更注重基于给定的上下文和逻辑给出可信的判断。实验结果表明,该方案比开源基础模型的准确率提升55%,与准确答案的对齐成本降低83%。此外,“可信对齐”在生成文字的流畅度方面比传统方法提升30%,良好的性能将有利于语言模型在TO B严谨行业的应用落地。

_x0000_i1026

图说:国际顶级会议ICML2024

自监督学习被认为是机器智能达到人类水平的关键,其最大的特点是不依赖人工标注的数据标签,可自主观察和学习、提取有用的特征,并应用于各种任务,与人类学习的方式相似。自监督学习在为模型训练降本提效的同时,具备更好的知识泛化能力和持续学习能力,研究对推动AI发展有着深远意义。

举报

  • 相关推荐
  • 给AI打工的人,迷失在数据标注里

    北京798附近的一家咖啡馆内,AI数据标注师廖仔在交谈中一再提到店里的咖啡机器人。 在这家占地近3000平米的咖啡馆内,不少咖啡师围绕着中央圆形岛台工作,但其中最引人瞩目的是一台人型机械臂的咖啡机器人。据说,该机器人的脸还是依据咖啡店主理人建模而成。 如果时间回到三四年前,廖仔想不到机器人可以冲咖啡,也想不到自己会进入AI赛道。 99年出生的他,专科�

  • 如何用 AI工具 生成论文选题

    本教程介绍如何利用DeepSeek AI工具生成学术论文选题。首先需要明确自身专业、研究方向、兴趣领域等研究信息。通过特定格式构建提问指令,在DeepSeek平台输入后,AI会基于算法分析生成10个相关选题。用户需从研究价值、创新性、可行性等维度评估选题,筛选出最适合的研究方向。该工具能有效帮助研究者快速获取选题思路,提高学术论文创作效率。

  • 深耕大数据与AI,我来数科夯实科技底座

    文章介绍了金融科技行业数字化转型的快速发展,重点聚焦"我来数科"这一领先金融科技平台。该平台以大数据和人工智能技术为核心,通过自主研发的实时大数据处理平台,在风控、营销预测等场景实现秒级数据分析,已累计服务超6000万用户。平台通过与金融机构、互联网巨头等深度合作,优化产品逻辑和用户体验,解决普惠金融痛点。未来将持续深耕"科技+服务"双轮驱动模式,在合规与创新间寻求平衡,探索更具创造力的数字金融解决方案。

  • 外媒:亚马逊正在训练人形AI机器人,用来“送快递”!

    机器人不会疲劳、不需要福利、也无需加班费,对企业而言是极具吸引力的低成本替代者……

  • 从游泳训练到水陆影音,鲸语训练耳机2代首创三模合一

    专业运动音频品牌鲸语推出第二代骨传导训练耳机,创新实现"三模一体"功能:训练模式支持16频分组教学;蓝牙模式可秒连手机播放流媒体;MP3模式内置32GB存储。产品通过IP69防水认证,续航提升50%,水下训练达9小时。新增晴海蓝、竞速黄、珊瑚橙三色,采用液态硅胶材质提升佩戴舒适度。与洲克联名款同步上市,延续专业游泳装备基因。6月18日起全渠道发售,限时尝鲜价469元。

  • 移宇(Medtrum)A8 闭环人工胰腺系统,看这一篇就够啦

    移宇科技AID闭环人工胰腺系统由持续葡萄糖监测系统(CGM)、无导管贴片式胰岛素泵和APGO®算法组成。该系统支持手机APP和手持遥控器两种操作方式,体积小巧(200U泵仅13.8g),采用30G极细针头(直径0.3mm),佩戴舒适。临床研究显示,使用后患者血糖达标时间(TIR)从55.9%提升至81.5%,血糖波动显著降低。系统实现了自动基础、自动校正和自动餐食功能,并配备大餐模式和运动模式,通过AI算法简化糖尿病管理,特别适合儿童和活跃人群使用。

  • 又是行业首个!海尔智家入选2025中欧国际工商学院ESG白皮书

    海尔智家ESG实践再获权威认可,成为首个入选《2025中欧国际工商学院ESG白皮书》的家电企业案例。文章指出,海尔智家通过构建全球ESG沟通网络、设立区域可持续发展组织、开发节能产品(如省电58%的空调、节能60%的洗衣机等),将ESG融入业务全流程。其创新管理模式将ESG指标纳入员工激励体系,建立三级治理架构,并与高管薪酬挂钩。专家强调,ESG不应被视为负担,而是企业长期价值创造的核心驱动力。海尔智家案例证明,ESG实践能有效促进产品创新(如First Build平台吸引24.5万共创者)和市场成功(高端洗衣机售价3倍行业均价仍热销百万台),为行业树立了新标杆。

  • 在版权诉讼中,Anthropic 赢下了关键AI训练裁决

    就像任何渴望成为作家的读者一样,Anthropic的语言模型并非为了抄袭或取代原作,而是为了创造出完全不同的内容……

  • 商汤小浣熊牵手蚂蚁百宝箱,共建AI+数据分析方案

    商汤科技"小浣熊家族"与蚂蚁集团旗下智能体开发平台"蚂蚁百宝箱"达成生态合作,双方将联合打造"AI数据分析助手",为百宝箱用户提供大模型服务。该助手将支持多模态输入,能精准解析用户意图并提供针对性分析建议。目前小浣熊已推出网页版和小程序版,未来将登陆支付宝平台。此次合作将推动AI+数据分析场景落地,后续双方还将共同打造使用教程

  • 白象“多半”:坦露商标注册初心、直面误解并设法消除

    近日,白象方便面"多半袋"产品引发争议。网友质疑"多半"是商标而非实际增量,涉嫌误导消费者。白象回应称,"多半"商标是为区分产品份量,承认可能造成误解并致歉,承诺调整包装。部分网友力挺白象,指出其面饼重量确有增加,且企业态度诚恳值得点赞。业内人士表示,类似"一袋半"等商标在方便面行业普遍存在。此次事件提醒企业,发展�