首页 > 业界 > 关键词  > 微软最新资讯  > 正文

微软推出用于生物医学的多模态 AI 助手

2023-06-14 11:24 · 稿源:站长之家

站长之家(ChinaZ.com) 6月14日 消息:微软的研究人员展示了 LLaVA-Med,这是一种用于生物医学的多模式 AI 助手,可以处理图像和文本。

使用生物医学图像文本对应大型数据集来训练多模态 AI 模型。该数据集包括胸部 X 光、MRI、组织学、病理学和 CT 图像等。首先,该模型学习描述此类图像的内容以及重要的生物医学概念。然后,使用GPT-4生成的指令数据集对 LLaVA-Med(生物医学的大型语言和视觉助手)进行训练。

image.png

该数据集由 GPT-4基于生物医学文本创建,其中包含有关每个图像的所有信息,可用于生成有关图像的问答。微调,然后在图像和相应的 GPT-4示例上训练 LLaVA-Med。结果是一个可以用自然语言回答有关生物医学图像的问题的助手。

使用的训练方法允许 LLaVA-Med 在不到15小时的时间内在八个 Nvidia A100GPU 上进行训练。它基于Vision Transformer和Vicuna语言模型,后者又基于 Meta 的LLaMA。据该团队称,该模型具有“出色的多模式对话能力”。在用于回答视觉问题的三个标准生物医学数据集上,LLaVA-Med 在某些指标上优于之前的最先进模型。

image.png

LLaVA-Med 等多模式助手有朝一日可以用于各种生物医学应用,例如医学研究、复杂生物医学图像的解释以及医疗保健中的对话支持。

研究团队表示:“虽然我们认为 LLaVA-Med 代表了朝着构建有用的生物医学视觉助手迈出的重要一步,但我们注意到 LLaVA-Med 受到许多 LMM 常见的幻觉和弱深度推理的限制未来的工作将侧重于提高质量和可靠性。”。

举报

  • 相关推荐
  • OpenAI和微软的关系没那么糟,跟英伟达也没那么好

    OpenAI的动作比所有人想象的都要快。 上周二,OpenAI完成重组。其中一个重要变化是:彻底取消了与微软的排他性协议,结束了Azure长达六年的云服务独占模式。此前,OpenAI所有模型的训练、推理与部署都必须优先选择Azure,微软还享有优先购买权。 宣布与Azure“分手”后不到一周,OpenAI便火速宣布了与AWS的战略合作——双方达成一项价值380亿美元的云计算协议,OpenAI将全面接入

  • Shure IntelliMix™ Room 会议套装正式入驻微软中国创新中心 Shure与微软开启声智体验之旅

    2025年11月11日,舒尔全新会议音频解决方案IntelliMix™ Room套件在微软北京创新中心完成安装并投入使用。该方案专为现代会议室设计,提供一站式高品质音频服务,集成卓越音质、简易设置及强大云管理能力。通过微软Teams认证,无缝接入MTR生态系统,支持端到端加密通信,确保会议安全。用户可远程管理系统,降低运维成本。舒尔与微软合作,共同提升企业协作效率,首批体验用户反馈语音清晰流畅,显著优化沟通质量。

  • AI吃播开始和真人吃播抢“饭碗”

    被咬开时发出清脆声响的玻璃水果、镶嵌着宝石的首饰盒、播放着音乐的水晶球,甚至还有毛绒玩具labubu和金条……各种你能想到或者想不到的,都正成为AI吃播的“食材”,被AI主播们塞入嘴里,轻松咀嚼。 这是一场风靡国内国外的热潮。在国外,Tiktok上一位叫leilanikovac的博主发了一条AI吃熔浆的视频,点赞数突破81.7万,另一位博主在三天内发了11条切水果的视频后,粉丝数

  • 遇到平板电池问题,试试联想想帮帮AI服务智能体的AI智修功能

    联想推出“想帮帮AI服务智能体”,通过AI智修功能解决手机/平板常见故障。用户只需在APP中输入问题,AI即可自动检测电池耗电快、断触、游戏卡顿等异常,结合知识库智能诊断并执行修复。系统具备主动预警、自动修复能力,严重故障时可协助预约售后。该服务覆盖设备全生命周期,提供快速定位、即时处理的一站式解决方案,让用户告别手动排查烦恼。

  • 爱诗科技下注的AI视频,正在比它预期的更「快」落地

    「我们决定全力投入视频生成领域,因为我们坚信视频生成一旦能够落地,其产品化和商业化的潜力可能不亚于大语言模型。」爱诗科技创始人兼CEO王长虎在2025年6月的一场演讲中,这样解释为什么要在2023年就坚定地选择AI视频生成这个非共识赛道作为自己的创业方向。 短短两年后,视频大模型的产品化和商业化潜力已经如王长虎判断的那样,在快速落地,形成自己的创作生�

  • 蚂蚁也正式加入AI超级入口战场,他的名字,叫灵光。

    蚂蚁集团推出全新AI助手“灵光”,以极致用户体验为核心突破传统AI工具。其亮点包括:结构化排版回答、交互式图表生成、3D模型渲染(如越王勾践剑动态演示),并支持闪应应用——用户可通过自然语言指令快速生成定制化小程序(如人生计时器、财报分析工具)。结合支付宝生态潜力,未来或实现真实账单管理与订阅优化。产品通过优雅设计唤醒用户探索欲,重新定义�

  • 这个双11,为什么AI成了下单的主要催化剂?

    今年双11已经走到第17个年头,消费者依旧熬夜比价,商家照样通宵盯盘,但后台的「发动机」已经换了芯。 当AI从大模型论文里走出来,第一站就上了电商——这个离钱最近、数据最肥的试验田。 淘宝把大模型塞进搜索框,一句「清理下水道小飞虫的东西」这样口语化的表达,也能打捞数十亿SKU;豆包把商城藏进对话框,边闲聊边下单,让购物像发朋友圈一样随手;飞书则远�

  • 科杰科技入选赛迪AI Infra平台市场研究报告,引领Data&AI数据基础设施新范式

    近日,赛迪顾问发布《2025中国AI Infra平台市场研究报告》,全面梳理中国AI基础设施平台市场格局、技术趋势与竞争态势。报告显示,2024年中国AI Infra平台市场规模达345亿元,预计2025年将飙升至673亿元,同比增长95.1%。企业AI应用正从单点验证迈向嵌入核心业务流的深度阶段,对基础设施提出更高要求。科杰科技凭借Data&AI融合架构、湖仓一体引擎及企业级AI落地能力强势入选,位列“挑战者”象限,彰显其在Data&AI领域的领先地位。

  • 让AI为你打工有多爽?企业如何选对AI员工?尘锋AI员工,帮您真正复刻优秀员工!

    本文探讨2025年AI员工在各行业的广泛应用,强调其核心价值在于替代人工处理重复性、流程固定的工作,如客服、销售等,实现效率提升与成本优化。文章指出,企业选择AI员工需关注四个关键维度:技术专业度、系统开放性、安全合规性及服务可靠性,并以尘锋AI为例说明如何通过智能协作、数据整合推动业务增长。最终总结,雇佣AI员工是企业面向未来的战略布局,需选择匹配需求的可靠产品以构建竞争优势。

  • 阿里下场抢AI超级流量入口了

    在过去三年的全球AI军备赛中,阿里巴巴的主要精力放在面向B端的AI基建上,在To C的AI原生应用中,并没有投入过多精力。高盛也提出了“中国人工智能产业,AI基建看阿里,AI应用看腾讯”的观点。 然而,阿里巴巴不会轻易放过争夺下一代超级流量入口的机会,在2025年临近收官之际,向行业又投下一颗重磅炸弹。 在阿里启动“千问”项目的消息传出四天后,11月17日,阿里�

今日大家都在搜的词: