首页 > 业界 > 关键词  > 人工智能+最新资讯  > 正文

蚂蚁集团智能凭证安全产品全项通过信通院能力测评,获评级

2024-04-29 14:34 · 稿源:站长之家

站长之家(ChinaZ.com)4月29日 消息:4月28日,中国信通院“人工智能++”高质量发展研讨会在北京召开。会上,中国信通院发布“可信AI”系列评测结果。蚂蚁集团智能凭证防伪检测安全产品“蚂蚁光鉴”全项通过“可信AI-OCR服务智能化”的评估,获得最高评级(增强级)认证。

e7ab544125f46af4d34342ad7880251.jpg

蚂蚁光鉴是蚂蚁集团自主研发的智能凭证防伪检测安全产品。该产品依托于蚂蚁十余年的AI技术积淀和专家领域经验,通过OCR(光学字符识别)、深度学习、人脸识别等融合技术,可实现对多场景、多语种、高精度的图文凭证票据自动化检测与识别服务。检测范围包含通用文字识别、通用图片防伪、个人卡证、企业资质、经营资质、行业文档等,累计可支持识别400+项凭证类型,50+种造假手法。

面对日益严峻的Deepfake深度伪造及AIGC假证风险,该产品还将多模智能解析和多模篡改检测等技术融入防伪检测方案,持续构建业内领先的数据生成和防伪检测算法。据了解,该产品可覆盖17种AIGC生成手法和25种面部攻击类型,通过自研的大模型预训练系统进行智能化对抗训练,可大幅度提升深度生成防御检测能力。

目前,该产品已广泛应用于蚂蚁集团风控、生态、商业化场景中,在支付、互金、银行、保险、政务、医疗等领域得到大规模落地,其SaaS服务累计调用量达10亿;相关技术研究获得国内外专利18项,其Deepfake检测能力于2023年通过中国信通院深度伪造视频检测服务能力检验。

在数字化发展过程,互联网平台涌现种类繁多的凭证物料,如企业资质、外籍用户护照、购物小票等。然而,随着AIGC等技术的广泛使用,智能凭证伪造技术门槛急剧下降,黑产用极低成本即可大批量生成任何类型的假证图片,导致业务风险激增。作为将图像信息转换为文字信息的关键技术,OCR技术能在多场景下实现数据信息提取,有效提高业务效率,也能帮助机器更好理解图像和文档,推动AI在图像识别与文档处理领域中的可信化落地,得到业界广泛关注和应用。

本次测评遵循中国信通院发布的《OCR服务智能化分级技术要求和评估方法》,围绕OCR服务的功能特性、性能表现、服务稳健性及隐私安全四大核心维度展开,评估覆盖十余项关键技术指标。比如在性能上,要求即使面临弱光、侧视角、反光、模糊等复杂环境挑战,OCR系统仍需保持高度的识别准确性。蚂蚁光鉴服务均符合要求,并以高达99.45%的识别准确率获得中国信通院“增强级”

举报

  • 相关推荐
  • 大家在看
  • Joor:完美的日记应用,记录你的想法。

    Joor是一款日记应用,它允许用户写下自己的想法,并由应用自动处理其余部分。它提供了一个简洁的界面,让用户能够轻松地记录下自己的思考和灵感,同时可能还具备一些自动整理和回顾的功能。

  • Samba:高效无限上下文语言模型的官方实现

    Samba是一个简单而强大的混合模型,具有无限的上下文长度。它的架构非常简单:Samba = Mamba + MLP + 滑动窗口注意力 + 层级MLP堆叠。Samba-3.8B模型在Phi3数据集上训练了3.2万亿个token,主要基准测试(例如MMLU、GSM8K和HumanEval)上的表现大大超过了Phi3-mini。Samba还可以通过最少的指令调整实现完美的长上下文检索能力,同时保持与序列长度的线性复杂度。这使得Samba-3.8B-instruct在下游任务(如长上下文摘要)上表现出色。

  • TC-Bench:视频生成模型的时间组合性评估工具

    TC-Bench是一个专门用于评估视频生成模型的时间组合性的工具。它通过精心设计的文本提示、相应的真实视频以及强大的评估指标来衡量视频生成模型在不同时间点上新概念的出现及其关系转换的能力。TC-Bench不仅适用于文本条件模型,也适用于图像条件模型,能够进行生成性帧插值。该工具的开发旨在推动视频生成技术的发展,提高生成视频的质量和一致性。

  • Promptchains:智能AI工作流构建器,释放AI潜力。

    Promptchains是一个革命性的AI工作流构建器,旨在通过提示链技术解锁AI的潜力。它将复杂任务转化为智能解决方案,实现AI的承诺。产品通过组合AI提示和其他工具到工作流中,使企业能够轻松定制、保存、重用和分享。它超越了AI交互的新奇性,创造了能够与熟练的人类员工并肩工作的解决方案。

  • Sanctuary:个性化冥想引导,由AI驱动,提升专注力,减压助眠。

    Sanctuary是一款利用尖端AI技术为用户提供个性化冥想指导的应用程序。它通过智能学习用户偏好,提供每日更新的冥想内容,帮助用户改善专注力,减少压力,并促进更好的睡眠。该应用拥有超过10万次的个性化冥想创建记录,用户反馈显示,它简化了冥想过程,使冥想变得容易和可访问,对于缓解焦虑和整体压力水平有显著效果。

  • Partnerplace:合作伙伴管理工具,提升合作效率。

    Partnerplace是一款专为合作伙伴关系管理设计的在线工具,它通过自动化繁琐的任务,如佣金处理,帮助企业高效管理和发展合作伙伴网络。该工具支持定制化合作伙伴计划,实现品牌专业体验,并通过集中化平台提高工作效率。Partnerplace的价值观包括弹性、参与度和连接性,旨在为用户提供一个完全定制化的、参与性强的、连接销售团队和CRM系统的合作伙伴管理系统。

  • Depth Anything V2:先进的单目深度估计模型

    Depth Anything V2 是一个经过改进的单目深度估计模型,它通过使用合成图像和大量未标记的真实图像进行训练,提供了比前一版本更精细、更鲁棒的深度预测。该模型在效率和准确性方面都有显著提升,速度比基于Stable Diffusion的最新模型快10倍以上。

  • OTTO SEO by Search Atlas:革命性的AI SEO工具,简化SEO工作流程。

    OTTO SEO是Search Atlas推出的一款AI驱动的SEO工具,旨在通过自动化技术优化网站,提高SEO效率。它通过添加OTTO像素到网站,能够自动执行网页优化,包括技术修复、内容优化、反向链接建设和内容创作。OTTO SEO的主要优点在于节省时间、提高效率,并帮助营销团队或代理公司实现SEO策略的自动化和优化。

  • AI drafts by Help Scout:提升客服团队效率,实现个性化客户服务。

    Help Scout提供的AI客服平台,通过人工智能技术,帮助客服团队提升工作效率,减少重复性工作,让团队成员能够专注于更复杂和个性化的客户对话。平台特点包括无需编程即可使用、快速回复、提升客户满意度,以及通过AI生成回复草稿等。

  • OpenVLA:开源视觉-语言-动作模型,推动机器人操作技术发展。

    OpenVLA是一个具有7亿参数的开源视觉-语言-动作(VLA)模型,通过在Open X-Embodiment数据集上的970k机器人剧集进行预训练。该模型在通用机器人操作策略上设定了新的行业标准,支持开箱即用控制多个机器人,并且可以通过参数高效的微调快速适应新的机器人设置。OpenVLA的检查点和PyTorch训练流程完全开源,模型可以从HuggingFace下载并进行微调。

  • VideoLLaMA 2:视频理解领域的先进空间-时间建模与音频理解模型。

    VideoLLaMA 2 是一个针对视频理解任务优化的大规模语言模型,它通过先进的空间-时间建模和音频理解能力,提升了对视频内容的解析和理解。该模型在多选视频问答和视频字幕生成等任务上展现了卓越的性能。

  • HumanPlus:人类动作模仿与自主技能学习系统

    HumanPlus是一个研究项目,旨在通过模仿人类动作来训练人形机器人,从而实现自主技能学习。该项目通过模拟强化学习训练低级策略,并将这些策略应用到真实世界中,实现实时跟踪人类身体和手部动作。通过影子模仿技术,操作员可以远程操作机器人收集全身数据,用于学习不同任务。此外,通过行为克隆技术,机器人能够模仿人类技能,完成各种任务。

  • Jace:AI助手,助力高效营销与管理。

    Jace是一款商业领域的AI助手,专注于提升营销效率,无需专业技能即可轻松启动和管理营销活动。其主要优点包括创建针对性的营销活动、实时监控性能和随时优化。

  • ARC-AGI:人工智能通用推理测试集

    ARC-AGI是一个旨在测试人工智能系统是否具备类似人类一般流体智力的抽象和推理能力的数据集。它由400个训练任务和400个评估任务组成,每个任务都以JSON格式存储,包括输入输出对。该数据集可以作为人工智能基准测试、程序合成基准测试或心理测量智力测试。

  • PROTEUS:实时表情生成人类模型

    PROTEUS是Apparate Labs推出的一款下一代基础模型,用于实时表情生成人类。它采用先进的transformer架构的潜在扩散模型,创新的潜在空间设计实现了实时效率,并能通过进一步的架构和算法改进,达到每秒100帧以上视频流。PROTEUS旨在提供一种通过语音控制的视觉体现,为人工对话实体提供直观的接口,并且与多种大型语言模型兼容,可定制用于多种不同应用。

  • Warp:AI和协作工具重新定义的终端

    Warp是一款使用Rust语言编写的终端应用程序,它通过集成AI和协作工具,提供了现代化的编辑、命令生成、可复用工作流和知识共享等功能,旨在提升开发者的生产力。Warp的AI功能可以建议正确的命令或解答编程问题,同时保持请求的私密性和安全性。Warp Drive允许用户组织难以记忆的命令,提高个人和团队的效率。此外,Warp还提供了自定义主题和以隐私为设计原则的安全性。

  • TalkWithGemini:一键部署您的私人Gemini应用

    TalkWithGemini 是一款支持一键免费部署的跨平台应用,用户可以通过这个应用与 Gemini 模型进行交互,支持图片识别、语音对话等多模态交互方式,提高工作效率。

  • PowerInfer-2:专为智能手机设计的高效大型语言模型推理框架

    PowerInfer-2是一个为智能手机特别优化的推理框架,支持高达47B参数的MoE模型,实现了每秒11.68个token的推理速度,比其他框架快22倍。它通过异构计算和I/O-Compute流水线技术,显著减少了内存使用,并提高了推理速度。该框架适用于需要在移动设备上部署大型模型的场景,以增强数据隐私和性能。

  • emo-visual-data:表情包视觉标注数据集

    emo-visual-data 是一个公开的表情包视觉标注数据集,它通过使用 glm-4v 和 step-free-api 项目完成的视觉标注,收集了5329个表情包。这个数据集可以用于训练和测试多模态大模型,对于理解图像内容和文本描述之间的关系具有重要意义。

  • E3Gen:高效、表现力强、可编辑的数字头像生成

    E3Gen是一种新型的数字头像生成方法,能够实时生成高保真度的头像,具有详细的衣物褶皱,并支持多种视角和全身姿势的全面控制,以及属性转移和局部编辑。它通过将3D高斯编码到结构化的2D UV空间中,解决了3D高斯与当前生成流程不兼容的问题,并探索了在涉及多个主体的训练中3D高斯的表现力动画。

今日大家都在搜的词:

热文

  • 3 天
  • 7天