约翰・霍普金斯大学发布 EGO-Prompt 框架，助力小型 AI 模型实现大模型性能提升

2025-11-12 08:56 · 来源： AIbase基地

近日，约翰・霍普金斯大学推出了一种名为 EGO-Prompt 的框架，该框架显著提高了小型语言模型在专业领域任务中的表现，性能提升近50%，同时将成本降低了83%。这一创新的框架主要用于解决专业领域任务，如医疗诊断和交通管理，使得小型 AI 模型能够媲美大型推理模型。

在实际应用中，设计合适的提示词是一个挑战，这不仅需要融入专业领域知识，还要确保 AI 能有效推理并提炼关键信息。EGO-Prompt 框架的核心在于它能自动生成优化的提示词，并结合因果逻辑帮助 AI 像人类一样分步思考。

该框架从专家提供的简单提示和因果关系图开始，经过自动优化，生成具体推理指引，使 AI 的思考更为清晰。这一过程通过真实数据反复调整因果图和提示词，直到达到最佳效果。此外，EGO-Prompt 还能提升模型的可解释性，让用户更容易理解 AI 的判断依据。

与之前的最佳方法相比，EGO-Prompt 的 F1分数平均提高了7.32% 到12.61%。使用这一框架的小型 AI 模型，能够在成本低至原有的20% 下，达到大型 AI 模型的效果。这种动态的知识进化方式，使得专家知识不再是静态的，而是与模型共同成长。

EGO-Prompt 的创新之处在于将专家知识从静态图谱转变为语义因果图（Semantic Causal Graph， SCG），并允许初始图谱存在一定的不完美。这种容错设计使得优化过程更为灵活，从而避免了模型在生成过程中可能出现的语义漂移。

EGO-Prompt 通过精巧的两阶段推理机制，将推理过程分解为指导生成和条件推理两个步骤，极大降低了模型的认知负荷，使其在处理复杂的专业领域数据时更加高效。

github：https://github.com/miemieyanga/EGO-Prompt

划重点:
- 🚀 EGO-Prompt 框架使小型 AI 模型的性能提升近50%，成本降低83%。
- 📊 新方法通过自动优化提示词和因果逻辑，提升 AI 推理能力。
- 🧠 采用语义因果图，允许初始知识图存在不完美，推动知识动态进化。

相关推荐

荐AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.5-VL；GPT-5.1“隐身”登场

本期AI日报聚焦多项技术突破：月之暗面开源AI代理框架Kosong，支持异步编排与插件化设计；Replit推出AI集成功能，可一键调用300+模型；商汤发布空间智能模型SenseNova-SI，性能超越GPT-5；百度推出多模态模型ERNIE-4.5-VL，新增图像思考能力；谷歌地图全面AI化，集成Gemini实现智能交互；ChatTutor上线可视化教学系统，覆盖多学科实时推演；新版Google Finance引入AI深度搜索与财报追踪；OpenAI低调上线Polaris Alpha模型，支持256K上下文并更新知识库至2024年10月。

AI代理开源框架异步编排
荐AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推出小度AI眼镜Pro

国家广电总局宣布自2026年3月起全面整治AI生成内容，要求AIGC作品纳入分类分层审核体系。360发布《大模型安全白皮书》，提出全链路AI安全防线应对新型威胁。百度推出2299元小度AI眼镜Pro，集成智能翻译等多项功能。StepFun开源音频编辑模型Step-Audio-EditX，实现文本化语音编辑。Grok新增纯文本生成视频功能，17秒可生成带特效视频片段。研究发现谷歌Veo-3模型能生成逼真手术视频但缺乏医学逻辑。阿里Qwen3-Max-Thinking在全球数学竞赛夺冠，并在加密货币交易中取得显著回报。OpenAI推出轻量化GPT-5 Codex Mini模型，优化开发者体验。

AI动画广电总局 AIGC审核
易鑫正式发布汽车金融行业首个Agentic大模型

易鑫在2025世界互联网大会乌镇峰会上发布汽车金融行业首个Agentic大模型XinMM-AM1。该模型参数量约300亿，响应延迟低于200毫秒，支持语音实时交互，单卡吞吐达370 tokens/秒，可提升获客、风控与运营效率，解决行业周期长、交互多、决策复杂等难题。易鑫作为AI驱动的金融科技平台，研发投入超20亿元，率先实现AI全场景应用，将持续推动智能汽车金融生态建设。

汽车金融大模型易鑫
百度搜索推出“百度猎户座”AI引擎，涵盖基座模型、搜索AI API、 MCP、垂类优势能力

2025年11月13日，百度发布“百度猎户座”AI引擎，全面开放25年搜索技术与前沿AI能力。该系统整合底座模型、搜索API、MCP及垂直领域能力，基于多智能体架构统一连接信息、工具、服务与模型，融合搜索技术优势与全网MCP生态资源。即日起对外开放，支持企业快速接入打造专属AI应用。同时，文心助手上线个性化记忆功能，视频生成推出“参考生成”玩法，AI短剧创作平台免费提供超30万部IP资源及全流程工具。

百度猎户座 AI引擎搜索技术
【AI 智惠季】全模态大模型齐发优惠，GPU新客包月2.8折起

阿里云启动双十一“AI智慧季”大型优惠活动，聚焦企业多元AI场景落地需求，推出7000万tokens大模型免费体验、GPU新客特惠等政策，助力企业降低开发成本。同时提供标准化AI产品与解决方案，覆盖内容创作、智能客服等高频应用场景，并举办系列技术分享活动，携手企业拥抱AI新时代。

AI技术阿里云双十一优惠
颠覆Diffusion局限！Utopai双模型耦合架构，攻克AI影视长叙事核心难题

Utopai Studios推出专为影视制作设计的AI模型与工作流，区别于主流视频生成模型，其核心能力在于理解剧本、规划镜头及生成场景，通过自回归模型负责叙事规划与一致性约束，扩散模型专注高质量画面渲染。该系统能解决跨镜头元素漂移难题，提升制作效率与作品品质。目前工作流仅用于公司自有项目，强调AI作为创作者协作者的角色，并遵循行业道德与版权规范。

AI影视制作 Utopai Studios
登榜LMArena！文心大模型5.0-Preview文本能力国内第一

11月8日，文心全新模型ERNIE-5.0-Preview-1022在LMArena大模型竞技场排名中位列全球第二、中国第一。该模型在创意写作、复杂长问题理解和指令遵循方面表现突出，超越多款国内外主流模型。创意写作可高效生成文章、营销文案等内容；复杂长问题理解适用于学术问答、报告分析等任务；指令遵循能力支持智能助理、代码生成等场景，为多领域内容生产提供高效支撑。

文心模型 ERNIE-5.0 创意写作
何小鹏首次披露物理AI巨大进展发布第二代VLA大模型

小鹏汽车在2025科技日发布第二代VLA大模型，颠覆传统“视觉-语言-动作”架构，实现端到端直接输出动作指令，开创物理模型新范式。该模型具备动作生成与物理世界理解能力，参数规模达数十亿级，训练数据近1亿clips。基于2250TOPS算力的Ultra车型成功搭载，推动智驾技术显著进化，同步发布“小径NGP”功能，复杂小路接管里程提升13倍。行业首发的无导航辅助驾驶Super+LCC实现全球覆盖。何小鹏表示，大模型将成为物理AI世界的操作系统，并宣布与大众汽车达成战略合作，共同推进智能出行发展。

小鹏汽车 VLA大模型智能出行
突破大模型对齐瓶颈，北大团队携手昇腾打通产业应用通路

北大杨耀东团队研发Align-Anything多模态对齐框架，以RLHF为核心解决传统反馈信息有限问题，覆盖文本、图像、音频等全模态数据。该框架集成专用评估工具Eval-Anything，已在昇腾平台实现智慧医疗、网络安全等领域规模化落地。通过构建安全治理体系，显著提升大模型安全水位，同时保持通用能力。团队联合推出课程培养人才，深化产学研协同，为多模态大模型发展提供关键技术支撑。

多模态大模型产业智能化升级模型训练与推理
简知科技“简智AI大模型”通过国家生成式人工智能服务备案，助力兴趣教育迈向智能化新阶段

广州简知科技自主研发的“简智AI大模型”通过国家生成式人工智能服务备案，标志着该模型在安全性、合规性与可靠性方面达到国家级标准。作为兴趣教育领域AI应用的重要里程碑，该模型围绕用户兴趣成长周期设计，提供个性化学习支持：可为未明确兴趣方向的用户智能推荐内容，为入门用户规划学习路径，为基础扎实用户提供进阶训练与智能反馈。其技术能力在旗下“简小知”等品牌中已实现“学—练—评—测”全流程覆盖，并通过社群互动增强学习动力。公司未来将持续优化模型能力，联合行业伙伴构建完整培养体系，推动兴趣教育向个性化、高质量方向发展。

简智AI大模型生成式人工智能兴趣教育

今日大家都在搜的词：

热文

3 天
7天

约翰・霍普金斯大学发布 EGO-Prompt 框架，助力小型 AI 模型实现大模型性能提升

荐AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.5-VL；GPT-5.1“隐身”登场

荐AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推出小度AI眼镜Pro

易鑫正式发布汽车金融行业首个Agentic大模型

百度搜索推出“百度猎户座”AI引擎，涵盖基座模型、搜索AI API、 MCP、垂类优势能力

【AI 智惠季】全模态大模型齐发优惠，GPU新客包月2.8折起

颠覆Diffusion局限！Utopai双模型耦合架构，攻克AI影视长叙事核心难题

登榜LMArena！文心大模型5.0-Preview文本能力国内第一

何小鹏首次披露物理AI巨大进展发布第二代VLA大模型

突破大模型对齐瓶颈，北大团队携手昇腾打通产业应用通路

简知科技“简智AI大模型”通过国家生成式人工智能服务备案，助力兴趣教育迈向智能化新阶段

今日大家都在搜的词：

热文

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

影视飓风CEO在相亲角被大妈吐槽网友：大妈不识货

雷军回应小米双11战绩：谢谢大家支持

卢伟冰：小米手机双11连续三年国产销量第一

AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.

腾讯回应QQ群最早是为了员工约饭：是一个朴实无华的需求

华为Mate 70 Air今日开售：处理器双版本可选售价4199元起

95岁巴菲特每周还上5天班此前计划年底退休

微信宣布治理恶意外部链接：6类违规内容将遭限访

京东发布双11战报：订单总量增长近60% 下单用户同比增长40%

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

影视飓风CEO在相亲角被大妈吐槽网友：大妈不识货

雷军回应小米双11战绩：谢谢大家支持

AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推

卢伟冰：小米手机双11连续三年国产销量第一

OPPO Reno15系列定档11月17日发布

焕新享界S9开卖72小时预订突破8000台

AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.

腾讯回应QQ群最早是为了员工约饭：是一个朴实无华的需求

华为Mate 70 Air维修备件价格公布：换主板2499元

站长商机

​约翰・霍普金斯大学发布 EGO-Prompt 框架，助力小型 AI 模型实现大模型性能提升

今日大家都在搜的词：

热文

站长商机

约翰・霍普金斯大学发布 EGO-Prompt 框架，助力小型 AI 模型实现大模型性能提升