首页 > 业界 > 关键词  > AI训练素材最新资讯  > 正文

AI看懂医生“天书”:谷歌开发新模型识别处方手稿

2022-12-20 12:00 · 稿源: 快科技

你能看懂医生开出的处方手稿么?

无论是国内还是国外,医生的处方或是其他手稿,都让人怀疑医生是不是有什么自己的独特文字,无论怎么辨别都看不出到底写了什么。

现在,谷歌在近日召开的第八届Google for India年度活动上,宣布将利用AI来识别阅读这些宛如天书”一般的处方手稿。

目前,该技术在识别英文手稿上已经有了一定的进展,用户只需要拍下处方,Google Lens就会自动识别处方上的文字,经过处理之后突出显示提及的药物和服药频率。

据悉,这一方面是依靠谷歌在OCR识别方面的技术优势,另一方面也是得到了来自医生、药剂师的协助,通过足够的素材训练AI模型。

不过,该技术目前在对非英文手稿的识别上仍存在较大问题,这或许与目前AI训练素材来源的局限性有关。

举报

  • 相关推荐
  • AI日报:Qwen-Image-i2L可零门槛训练LoRA;智谱AI输入法全新发布;灵光推科普动画生成功能

    本期AI日报涵盖多项AI领域进展:OpenAI正对两款新图像生成模型进行盲测,性能显著提升;阿里通义千问推出Qwen-Image-i2L技术,可将单张图片快速转为可微调的LoRA模型,降低个性化风格迁移门槛;智谱AI开源GLM-ASR语音识别模型并推出桌面端输入法,提升语音交互体验;通用AI助手“灵光”上线科普动画生成功能,帮助可视化复杂科学原理;麦当劳AI生成圣诞广告因争议被撤;马斯克的xAI推出Halftime工具,可将AI广告实时植入影视内容,引发艺术完整性讨论;阿里巴巴成立“千问C端事业群”,整合夸克、UC等资源,旨在打造AI时代的超级APP;微软网页版Excel推出“智能体模式”,AI可深度参与复杂数据处理任务。

  • 谷歌AI眼镜官宣明年问世:搭载Gemini多模态模型

    谷歌宣布,正与三星、Gentle Monster及Warby Parker等合作伙伴共同研发两种类型的AI智能眼镜,预计新产品将于2026年面市。 谷歌硬件负责人Payne表示,公司已从过往经历中吸取教训。新款眼镜将深度集成其先进的Gemini大模型,在无需双手操作的情况下,用户可实现拍照、导航、接听电话及识别眼前物体等功能,其定位与Meta和雷朋合作推出的智能眼镜相似。 此次发布的产品线将分�

  • AI日报:蚂蚁推灵光网页版AI助手;智谱开源GLM-4.6V系列;谷歌Mixboard重磅升级

    本期AI日报聚焦多项AI领域进展:智谱开源GLM-4.6V系列模型,提供强大多模态处理能力;蚂蚁集团推出灵光网页版AI助手,支持快速生成应用;谷歌Mixboard集成自研图像模型,提升创意生产效率;抖音李亮强调AI手机助手需用户授权,与隐私无关。此外,上海交大发布全球首款光子芯片垂直大模型LightSeek,研发效率提升7倍;谷歌Doppl推出AI购物发现功能;智谱开源AutoGLM,推动手机端AI Agent发展;OpenAI与德国电信合作部署企业版ChatGPT,助力欧洲电信行业数字化转型。

  • 余杭,让AI与青才双向奔赴 ——“AI杭州 码动未来”AI模型智能体创新大赛圆满落幕

    “AI杭州+码动未来”AI模型智能体创新大赛决赛近日在余杭落幕。作为2025杭州国际人才交流与项目合作大会的重点活动,大赛吸引了近200名AI领域青年才俊、专家学者及产业代表参与。赛事聚焦“AI+大健康”“AI+未来教育”“AI+办公提效”“AI+具身智能”四大前沿方向,汇聚了来自北京大学、浙江大学、中国人民大学等顶尖高校及高潜力初创企业的550余名青年人才,征集项目200余个。经过激烈角逐,最终评选出一等奖4项、二等奖4项、三等奖8项及优秀奖8项。大赛不仅是竞技平台,更是产业化的起点。余杭区通过设立总奖金池、提供办公空间免租、推出算力券模型券等政策,并联动“海创未来”人才项目、创新创业项目等,构建了覆盖技术研发、场景验证、精准服务的产业支撑体系,旨在为青年人才提供从创新到创业的全周期支持,打造AI开发者一站式服务平台,推动人才与产业双向奔赴。

  • AI吃播,开始和真人抢饭碗?

    被咬开时发出清脆声响的玻璃汉堡和水果、镶嵌宝石的首饰盒、能放音乐的水晶球,甚至毛绒玩具Labubu和金条……无论你能想到还是想不到的物品,如今都成了AI吃播的“食材”,被AI主播们轻松塞进嘴里、大口咀嚼。

  • 男子海洋馆内抽烟被白鲸喷水浇灭:训练形成条件反射

    ​近日,大连某海洋馆内发生的一起白鲸“精准喷水制裁”吸烟者事件,在网络上引发广泛关注。这场看似滑稽的动物“反击”,不仅成为大众热议的话题,更意外揭开了公共场所禁烟困境的冰山一角。 在该海洋馆内,一名男子对馆内醒目的禁烟标识视而不见,面对女性工作人员多次劝阻,依旧执意点燃香烟。就在他吞云吐雾之时,池中名为“石榴”的白鲸突然跃出水面,一

  • 巴西男子健身被杠铃砸胸身亡 自由重量训练安全引热议

    ​近日,一段监控视频在全球网络引发轩然大波,画面中巴西男子罗纳德·蒙泰内格罗在健身房被杠铃砸中胸口后踉跄站起又轰然倒地的场景,将自由重量训练的安全隐患推至舆论的风口浪尖。 2025年12月1日,在巴西奥林达市的一家健身房内,55岁的罗纳德·蒙泰内格罗正在进行杠铃训练。训练过程中,杠铃意外脱手,数十公斤重的杠铃重重砸向他的胸部。监控画面显示,在遭�

  • 生成式 AI 进入工程深水区:为什么“一站式训练到部署”正在成为企业的关键能力?

    生成式AI热度降温后,企业落地模型面临共同挑战:数据分散、训练与线上环境割裂、模型更新与推理服务脱节、推理成本飙升。核心在于从训练到部署能否形成闭环,而非模型本身。一站式平台通过统一工具链、工程体系和治理能力,解决数据进场、训练更新、推理稳定等底层问题,降低边际成本,让AI项目从试验转向可持续业务。AWS等平台以生产系统思维,将模型作为企业资产持续管理。

  • AI日报:蚂蚁发布“阿福”App;OpenAI Sora 安卓版开发揭秘;Figma AI图像编辑功能上新

    本期AI日报聚焦多项AI领域新动态:OpenAI利用GPT-5.1-Codex高效开发Sora安卓版,85%代码由AI生成;蚂蚁集团升级AI健康应用“蚂蚁阿福”,新增健康陪伴等功能;Figma推出AI图像编辑工具,提升设计效率;深圳地铁上线全球首款AI导盲犬“小蒜”,服务视障人士;Adobe将Photoshop等工具集成至ChatGPT界面,方便用户编辑;OpenAI十周年推出Sora收藏卡等周边产品;谷歌Gemini新增NotebookLM功能,聊天可直接附加笔记;OpenAI计划推出ChatGPT“成人模式”,预计2026年前上线。

  • AI日报:Medeo AI新版视频Agent上线:OpenAI正式发布GPT-5.2;钉钉AI功能大升级

    本期AI日报聚焦多款AI产品更新:Medeo AI新版视频Agent支持自然语言一键改剧本,降低创作门槛;钉钉8.1.10将AI融入职场沟通,提升效率;OpenAI低调上线GPT-5.2,延迟显著降低,逻辑一致性提升,并推出支持私有化部署的成人模式;迪士尼投资100亿美元与OpenAI合作,推动IP在生成式AI中的创新应用;谷歌Gemini Deep Research开放API,供开发者构建研究应用;Cohere推出Rerank 4,上下文窗口扩展至32K,提升企业搜索精度;拓竹科技推出3D手办生成器“印你”,依托腾讯混元3D模型,简化3D建模流程;谷歌NotebookLM升级,为Ultra会员提供更高权限,优化智能笔记体验。

今日大家都在搜的词: