首页 > 传媒 > 关键词  > ICDAR最新资讯  > 正文

理光荣获2024年度国际文档分析与识别会议(ICDAR)官方赛事两项冠军

2024-09-09 16:50 · 稿源: 站长之家用户

2024年8月30日至9月4日,国际文档分析与识别会议International Conference on Document Analysis and Recognition(以下简称ICDAR)在希腊雅典举行。今年ICDAR设立了十余项竞赛,吸引了全球诸多知名科技公司和研究机构的参与。理光中国研究院NLP团队在ICDAR官方比赛“通过 Aria 眼镜阅读文档(Reading Documents Through Aria Glasses)”赛道上,斩获“低分辨率下的单词识别”及“页面级别的识别与阅读”两项任务的较高排名。

*“页面级别的识别与阅读”任务较高排名奖状

ICDAR赛事介绍

ICDAR由国际模式识别协会IAPR(International Association of Pattern Recognition)举办,是模式识别、计算机视觉领域、图像处理领域最为重要的国际学术会议之一,涵盖了文档分析与识别领域的最 新学术成果和前沿应用发展趋势。

“通过 Aria 眼镜阅读文档(Reading Documents Through Aria Glasses)”赛道,涉及到理解和处理使用Aria 设备*采集到的文本内容。任务目标是开发一系列稳健的图像处理算法来识别整个页面中的文字内容,同时保持正确的阅读顺序。具体来说,包括以下两个子过程:1)低分辨率下的单词识别:检测并识别来自Aria眼镜采集图像中的单词文本;2)阅读顺序预测:预测从页面中提取的单词级文本的阅读顺序(即页面上单词的序列)。

*ICDAR会场上,主办方介绍任务数据示例

*ICDAR会场上,主办方介绍任务目标与挑战

理光的突破创新与应用实践

理解文档是可穿戴人工智能系统的基本任务,需要开发解决方案,赋予系统阅读和理解文档中知识的能力。除了传统的文档分析挑战外,可穿戴设备图像还受到人体姿势的多样性、不同的光照条件、潜在的障碍物以及其他场景中主体的影响,这些因素在获取准确的光学字符识别(OCR)时增加了额外的障碍。

理光中国研究院将自身各种技术积累有机结合,在单词识别部分,搭建了以PARSeq(Permuted AutoRegressive Sequence)为基础的模型,采用了创新的模型迭代训练方法和成熟的数据合成技术,进一步提高了识别性能。在阅读顺序预测部分,理光没有将其定义为传统的排序任务或翻译任务,而是建模为具备语义分割能力的布局解析任务。基于在表格识别和图纸识别项目上的丰富经验,理光自研的语义分割框架,在任务数据上微调后,展现了优秀的解析效果。

理光中国研究院在OCR技术研究和各种场景下的项目实践经验方面有着深刻的理解。在基础技术研究方面,理光中国研究院一直致力于图像处理、文本检测、文本识别、布局分析、表格识别以及与文档理解相关的其他技术的研究,并取得了领先成果。在应用方面,理光中国研究院已成功将OCR技术适配到设计图纸、财务报告、合同、票据以及传统文档以外的其他领域。这些解决方案已经成功服务于多领域客户,并在特定需要的定制化适配方面积累了丰富的经验。

图纸档案数字化解决方案,可以实现扫描件表格文字识别,信息提取和比对,以及归档流程处理的自动化,有效解决海量图纸数字化过程中大量的信息查找,手动录入,人工审核,繁琐归档的难题,实现了有效智能的图纸数字化管理,90%以上峰程实现自动化。

财务文档数字化解决方案,可以实现各类财报文档自动识别,关键数据提取录入与结构化,同时配合金融领域风险评估模型,极大程度地提高了金融风险识别的效率和准确率。

合同比对解决方案,可以进行合同文档比对,将电子文档,扫描件等不同版本的合同文档进行智能分析比对,检测包含范本使用,文本修改,字符标点等各类差异,极大提高比对效率并控制风险。

合同审阅解决方案,可以对印章和关键内容进行识别和审阅:自动识别印章错盖漏盖,智能提取合同关键信息(例如合同主体,金额,时间,特殊条款等内容),提高复核,审批,以及自动化归档管理效率。

理光将继续秉承创新精神,不断深化技术研究,拓展OCR技术的应用领域,以满足不断变化的市场需求。我们期待与更多的合作伙伴携手,将我们的技术应用于更广泛的行业和场景中,共同推动人工智能技术的进步。同时,我们也将持续关注客户的需求,通过不断的优化和创新,提供更加准确、有效的解决方案,以帮助客户解决实际问题,提升工作效率。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 京东亮相上海国际碳中和博览会分享以旧换新经验 2024年助力碳减排超30万吨

    2025上海国际碳中和技术博览会于6月5日开幕,聚焦设备更新与消费品以旧换新。京东集团展示了"互联网+回收"数字化模式,2024年通过以旧换新回收超2000万台废旧家电,占全国规范拆解量的20%以上,助力碳减排超30万吨。京东推出"三免四不限"服务,覆盖200多品类,全国超90%县域可享以旧换新。通过数字化全流程管理,实现回收透明化、资源最大化利用。本届博览会彰显了企业在推动绿色发展和消费升级中的责任担当。

  • YouTube:2024年,我们为美国创造了 49 万岗位、550 亿美金GDP!

    YouTube 称他们的生态系统在 2024 年为美国创造 49 万个就业岗位、贡献 550 亿美元 GDP……

  • 双冠闪耀!宏陶瓷砖斩获2025新锐榜两项重量级大奖

    5月22日,第21届中国陶瓷卫浴行业新锐榜颁奖典礼盛大举行。宏陶瓷砖凭借卓越品质和创新实力,荣获"产品力领先企业"和"品质金奖"两项大奖,成为行业标杆。该品牌坚持全产业链严控品质,组建专业矿山开采团队全球选材,斥资打造千万吨级原料场,引进3万吨压机等顶尖设备,构建数字化质检体系。目前拥有49项科技成果和68项专利,产品涵盖高光釉石、岩板�

  • 《2024年全球电竞运动行业发展报告》正式发布:四座中国城市入选“全球电竞城市影响力”榜单前十

    6月17日发布的《2024全球电竞运动行业发展报告》显示,中国在全球电竞城市影响力前十中占据四席(上海、北京、深圳、成都),其中上海位列全球第三。中国用户对电竞奥运会的认知度达73%,居全球首位。报告指出,电竞显著提升城市吸引力,女性用户规模扩大正为产业注入新动能,中国女性观众占比从2020年的36%升至2024年的71.8%。中国已成为全球电竞"超级市场",汇聚最多电竞赛事版权方总部,用户消费参与度达86.2%。新兴市场对电竞态度积极,沙特将举办首届电竞奥运会。腾讯电竞表示将持续推动产业生态繁荣创新。(报告全文链接附后)

  • 曝iOS 26是半成品:苹果把两项重要功能留到了iOS 27

    iOS 26将在苹果WWDC上正式亮相,该系统将采用半透明的设计风格,新增游戏应用,但有两项与日历和健康有关的重要功能不会发布。 苹果记者马克古尔曼透露,苹果需要更多时间开发这两项功能,所以它们会在iOS 27等后续版本中亮相,iOS 26与之无缘。 具体来说,与日历和健康有关的两项功能都加入了AI技术,首先是日历应用,该应用具备自动安排会议时间、学习用户日程偏好�

  • SID 2025丨天马荣获“People's Choice Awards”三项大奖

    2025年5月15日,天马在SID Display Week展会上斩获三项"Peoples Choice Awards"大奖。获奖产品包括:全球首款三合一光感功能屏6.51"HOI AM-OLED,创新整合指纹识别、色温感知与寿命监控功能;12.3"LuminoWood隐私显示屏,实现全视角防窥与仿木纹装饰完美融合;16"WQXGA 1-360Hz氧化物显示屏,以行业最广刷新率范围实现超低功耗与电竞级性能。这些创新产品展现了天马在显示技术领域的领先实力,覆盖手机、车载、IT等多场景应用,彰显中国"好屏"技术的全球竞争力。

  • 中航未来丨2024级空中乘务专业·职业形象比赛圆满举行

    近日,中航未来&滁州城市职业学院·管理与信息学院,“ 2024 级空中乘务专业职业形象活动比赛”,成功举办。此次活动以“精技砺能 仪展芳华”为主题。参加比赛的 24 级空乘专业学生,经过严格考核, 8 名学子凭借卓越的职业素养与专业技能脱颖而出。空乘职业形象比赛聚焦空乘职业形象的核心要素,从妆容、发型、仪容仪表到服装搭配,全方位考核学生的专业素养。男生

  • 国际殊荣|中科慧远斩获CVPR 2025工业视觉异常检测挑战赛冠军

    中科慧远视觉技术在CVPR2025工业视觉异常检测挑战赛中夺冠。其创新方案"少样本学习下的逻辑与结构缺陷异常检测方法"融合CLIP、DINOv2和BEIT多模态特征,采用免训练架构和零样本学习技术,最终以0.936的Avg Image Score创下赛会最佳成绩。这是继2023年获奖后,该公司再次在国际计算机视觉顶级会议斩获殊荣,彰显了其在工业AI质检领域的技术实力。作为国内工业AI质检先行者,中科慧远持续深耕多模态大模型技术,其解决方案已在3C电子、半导体晶圆等制造领域积累丰富经验。未来公司将继续突破小样本学习等关键技术,为全球制造业智能化转型提供更精准的AI质检方案。

  • 海尔牵头两项国家重点研发项目正式启动

    海尔智家和卡奥斯牵头启动两大国家级重点研发项目:"链主企业管控的产业链协同平台"和"支撑产品设计/制造/服务一体化的数智化底座"。海尔成为家电行业唯一同时承担两个国家级重点项目的企业,将推动产业链优化升级和工业互联网核心技术突破。卡奥斯平台已赋能15大行业,服务超16万家企业,验证了"技术研发-场景验证-生态复制"模式的有效性。海

  • 《快手2024企业社会责任报告》发布,AI赋能多领域提质创新发展

    快手发布2024年企业社会责任报告,重点展示AI技术赋能社会发展的成果。报告显示,快手通过AI大模型技术矩阵,在创作者扶持、乡村振兴、文化传承、产业发展等领域取得显著成效。平台带动4320万个就业机会,培育174个新职业,并推出三级创作者成长体系。AI技术助力内容创作,推出"可灵AI"视频生成平台,降低创作门槛。在文旅领域,快手联合多地打造城市宣传短片,播放量超5000万次。此外,平台推动知识普惠,泛知识类视频发布量达1.9亿条,非遗相关内容创作者超1100万。快手还通过体育赛事转播和民间赛事融合,激活乡村体育活力。创始人杨远熙表示,AI不仅是效率工具,更是创造社会价值的新引擎。