机器学习工具Magi:自动为漫画生成文本帮助视障读者更容易地阅读漫画

2024-03-18 14:30 · 稿源：站长之家

划重点:
⭐️ 研究团队在牛津大学开发了名为 Magi 的先进工具，可以帮助视障读者更容易地阅读漫画。
⭐️ Magi 的方法包括智能地识别漫画页面上的面板、人物和文字块。
⭐️ 这项研究不仅突破了漫画可访问性的障碍，还展示了人工智能在提高可访问性方面的潜力。

站长之家（ChinaZ.com）3月18日消息:在讲故事方面，日本漫画，即漫画，在全球范围内赢得了巨大的市场，以其复杂的情节和独特的艺术风格吸引着观众的注意。尽管它们具有全球吸引力，但一个重要的潜在读者群体却被忽视了:视障人士。对于他们来说，漫画的视觉中心性创造了一个无法访问的领域，尽管漫画中有丰富的叙事。

当前漫画之所以难以访问，主要挑战在于将视觉丰富的内容转化为视障人士可访问的格式。早期的漫画在很大程度上依赖于交织的视觉元素和文字，使体验固有地具有视觉性。这种视觉依赖意味着视障人士通常无法参与漫画艺术家创造的故事、人物和世界。

目前使漫画可访问的解决方案远非理想，主要是因为它们依赖于手动转录或音频描述，这种方法劳动密集且难以有效扩展。这种差距突出了需要更有效的自动化方法来使所有观众都能够欣赏漫画，无论其视觉能力如何。

牛津大学的研究团队开发了一种先进工具，名为 Magi，这标志着使漫画对视障读者更具可访问性的突破。Magi 是一个打开以往因视觉障碍而锁定的故事的通道，为所有读者提供了新的参与水平。

Magi 的方法包括智能地识别漫画页面上的面板、人物和文字块，以及将对话与其相应的讲话者相关联，保持叙事的完整性。通过严格测试，Magi 展示了在检测和聚类人物以及将文本与正确的讲话者相关联方面的优越能力，超越了现有方法。这种效率展示了该工具的精确性，以及它改变漫画阅读为一种所有视障人士都可以享受的包容性活动的潜力。

这项研究和开发工作突显了辅助技术方面的重大进展。通过利用复杂的算法和机器学习，Magi 为无法看到的人打开了一个以前无法访问的漫画世界。这一创新的影响超越了漫画，它为技术如何弥合娱乐领域的鸿沟树立了一个先例，使其普遍可访问。

开发 Magi 有助于使文化和娱乐内容的获取更加民主化。它突显了向包容性转变的趋势，打破了享受乐趣的障碍，使故事变得普遍可访问。这项研究不仅突显了人工智能在提高可访问性方面的潜力，还号召进一步在这一领域进行创新。随着技术的发展，希望更多的大门会打开，让每个人无论身体上的限制如何，都能探索广阔多样的娱乐和文化景观。Magi 从概念到实施的历程揭示了通往一个更加包容的世界的道路，让故事的乐趣无限延伸。

产品入口:https://top.aibase.com/tool/magi

论文：https://arxiv.org/abs/2401.10224v1

（举报）

相关推荐

关键词：

荐双十一购物不烧脑！看AI全能搭子荣耀Magic8如何重塑消费体验

双十一来到第17个年头，购物火热程度未减，未到11月，各类优惠已来，但与此同时，购物的复杂度似乎也在增加。蹲点等红包、消费券、国补、88VIP会员、凑满减、主播补贴，各种玩法满天飞，但想要弄清楚具体的规则已经不易，再配合计算金额、卡时间，原本的购物热情，正在逐渐被消耗。在央视财经对消费者的调研中，几个

双十一购物优惠规则消费者痛点
YOUMAGIC舒立缇与北京清华长庚医院联合启动单极射频多适应症临床研究

10月27日，YOUMAGIC舒立绯与北京清华长庚医院联合启动射频技术临床研究计划。双方将开展单极射频设备在面部年轻化及痤疮治疗领域的有效性与安全性评估，聚焦轻中度皱纹合并痤疮的临床应用。通过前瞻性自身对照研究设计，结合标准化治疗方案，推动技术临床标准化与循证医学证据积累，为医企协同创新提供实践范本，助力行业高质量发展。

单极射频面部年轻化痤疮治疗
荣耀最强旗舰！荣耀Magic8 Ultra参数出炉

博主数码闲聊站曝光了荣耀Magic8 Ultra的参数细节，这是荣耀最强悍的影像旗舰。具体来说，荣耀Magic8 Ultra采用6.71英寸1.5K LTPO全等深微曲屏，搭载高通第五代骁龙8至尊版平台，支持3D人脸识别以及3D超声波屏幕指纹。并且该机主摄升级为豪威集团的OV50R，拥有5000万像素，还有全新大底潜望长焦，电池容量超过7000mAh。据悉，OV50R拥有1/1.3英寸超大底，这

荣耀Magic8 Ultra 影像旗舰
荣耀Magic 8系列上新，火山引擎助力“YOYO助理”多模态升级

10月15日，荣耀发布搭载全新MagicOS 10系统的Magic8系列手机、MagicPad3 Pro平板及荣耀手表5 Pro等年度旗舰新品。智能语音助手“YOYO助理”升级多模态交互能力，结合火山引擎与豆包大模型技术，支持联网问答、识图、修图、闲陪伴、口语练习、出行规划等场景，提供图文、语音、视频等多种输入输出形式，实现秒级响应与沉浸式交互体验，成为用户“口袋里的万能管家”。

荣耀Magic8系列 MagicOS10操作系统 YOYO助理
荐MiniMax让AI语音有了新基建

熟悉MiniMax的人都了解这家公司的调性——不鸣则已，一鸣惊人。要么选择低调，要么发动技术连招，其发展路径呈现出鲜明的“技术深潜”与“节点式爆发“的双重特征。十月的最后一周，再次进入MiniMax式技术迭代新周期。MiniMax模型“全家桶”全面向Agent方向进化，基础文本模型M1升级至M2，“专为Agent和代码而生”;视频模型升级至Hailuo2.3，Hailuo Video Agent迭代为“全模态全�

MiniMax 技术迭代 Agent
紫亚兰大会收官CDA亮相！YOUMAGIC舒立缇将携创新射频技术领航产业发展

10月17-19日，YOUMAGIC舒立绯作为独家冠名品牌亮相第八届紫亚兰国际抗衰老医美大会。大会汇聚全球300余位权威专家及300多个品牌，聚焦抗衰、再生医学及AI医疗等前沿领域，搭建学术交流与产业对接平台。舒立绯携清华智造技术及创新增长模式亮相，联合发布行业蓝皮书并开设医学论坛，通过产品体验区与临床案例分享，展示其高能射频设备在抗衰领域的技术突破，推动行业标准化与精准化发展。

紫亚兰大会抗衰老医美再生医学
YOUMAGIC舒立缇发布《中国射频类医美产品行业发展现状与未来趋势蓝皮书》

10月17日，YOUMAGIC舒立绯联合弗若斯特沙利文发布《中国射频类医美产品行业发展现状与未来趋势蓝皮书》。蓝皮书指出，中国非手术医美市场2024年份额达65%，射频类项目因恢复期短等优势成为增长最快细分赛道，预计2030年院线端射频设备市场规模将突破90.5亿元。报告系统分析了行业技术突破、产业链协同及合规化趋势，并以舒立绯国产创新设备为例，展现了中国企业通过"技术突破+合规先行"打破进口垄断的路径，推动行业向"高能、舒适、有效"方向发展。

射频类医美紫亚兰大会蓝皮书发布
荣耀Magic8/Magic8 Pro发布：售价4499元起

荣耀Magic8系列正式发布，包含Magic8和Magic8 Pro两款机型。全系搭载第五代骁龙8至尊版处理器，Pro版安兔兔跑分达428万创历史新高。屏幕方面，Magic8配备6.58英寸1.5K直屏，Pro版升级为6.71英寸等深四微曲屏，峰值亮度达6000nit。影像系统全面升级，Pro版搭载2亿像素潜望长焦，支持100倍数码变焦。续航上，Magic8内置7000mAh电池，Pro版提升至7200mAh，分别支持90W/120W有线快充。首发MagicOS 10系统，内置YOYO智能体，具备复杂意图理解能力。售价4499元起，10月15日开启预售，10月23日正式首销。

荣耀Magic8 荣耀Magic8Pro 手机发布
荐AI日报：可复刻音色的MiniMax Speech 2.6发布；TikTok推AI剪辑新工具“Smart Split”；Cursor 2.0发布

本期AI日报聚焦多项技术突破：MiniMax发布低延迟语音合成系统Speech 2.6，实现实时交互；蚂蚁数科与宁波银行打造的金融AI方案入选国际标准；智源推出具身操作能力的Emu3.5多模态模型；Cursor 2.0通过自研模型实现多智能体协同编程；xAI升级Grok新增视频生成功能；OpenAI推出可定制安全模型；TikTok推出AI剪辑工具Smart Split；微软发布强化学习框架Agent Lightning提升大模型训练效率。

AI日报 MiniMax Speech
荣耀Magic8系列维修备件价格公布：屏幕979元起主板2699元起

荣耀Magic8系列正式发售，起售价4499元。官网公布维修价格：屏幕组件979元（优惠价），主板2699元起，电池279-319元，摄像头189-879元不等。全系搭载骁龙8至尊版芯片，安兔兔跑分超428万。Magic8采用6.58英寸1.5K LTPO直屏，Pro版升级为6.71英寸等深四曲屏，并支持行业唯一的3D人脸解锁与超声波指纹识别。

荣耀Magic8 维修价格屏幕组件

今日大家都在搜的词：

热文

3 天
7天

机器学习工具Magi:自动为漫画生成文本帮助视障读者更容易地阅读漫画

荐双十一购物不烧脑！看AI全能搭子荣耀Magic8如何重塑消费体验

YOUMAGIC舒立缇与北京清华长庚医院联合启动单极射频多适应症临床研究

荣耀最强旗舰！荣耀Magic8 Ultra参数出炉

荣耀Magic 8系列上新，火山引擎助力“YOYO助理”多模态升级

荐MiniMax让AI语音有了新基建

紫亚兰大会收官CDA亮相！YOUMAGIC舒立缇将携创新射频技术领航产业发展

YOUMAGIC舒立缇发布《中国射频类医美产品行业发展现状与未来趋势蓝皮书》

荣耀Magic8/Magic8 Pro发布：售价4499元起

荐AI日报：可复刻音色的MiniMax Speech 2.6发布；TikTok推AI剪辑新工具“Smart Split”；Cursor 2.0发布

荣耀Magic8系列维修备件价格公布：屏幕979元起主板2699元起

今日大家都在搜的词：

热文

AI日报：美团LongCat-Flash-Omni发布；Qwen3-Max上线深度思考功

DeepSeek崩了上热搜页面显示“服务器繁忙”

特斯拉Cybercab不配备方向盘和踏板预计2026年二季度下线

OPPO ColorOS 16正式版11月升级机型公布：支持23款机型

鸿蒙HarmonyOS 6与iOS数据互传功能预计12月上线

真我GT8 Pro阿斯顿马丁F1限量版将于11月10日正式开售

何小鹏：小鹏X9超级增程是全球续航最长的大七座车

真我GT8 Pro阿斯顿马丁F1限量版外观公布

卢伟冰评Air手机：大胆创新但极致薄牺牲用户体验

OPPO ColorOS 16正式版推送：首批适配11款机型

AI日报：可复刻音色的MiniMax Speech 2.6发布；TikTok推AI剪辑

微信升级：支持一次撤回全部消息、删好友能保留聊天记录等功能

AI日报：Sora免费额度要缩水；月之暗面发布Kimi Linear架构；C

苹果客服回应iPhone或自动拨号：设置或其他问题

vivo OriginOS 6启动公测招募：支持10款机型

魅族22月白天青配色发布：2999元起

小米随身蓝牙音箱曜石黑配色版本开售：售价299元

iQOO Neo11开售2小时销量超前代全天

REDMI官方：REDMI K90超级像素新国屏比2K屏更强

站长商机

机器学习工具Magi:自动为漫画生成文本 帮助视障读者更容易地阅读漫画

今日大家都在搜的词：

热文

站长商机

机器学习工具Magi:自动为漫画生成文本帮助视障读者更容易地阅读漫画