首页 > AI头条  > 正文

微软全新开源模型 MAI-DS-R1:敏感话题响应提升,安全风险降低

2025-04-18 16:21 · 来源: AIbase基地

微软在其官网上正式开源了 DeepSeek-R1的魔改版 ——MAI-DS-R1。这一新模型在保留原有推理性能的基础上,进行了显著的增强,尤其在对敏感话题的响应能力上取得了巨大的突破。

QQ_1744964448252.png

MAI-DS-R1的响应能力达到了99.3%,是原版 R1的两倍多。这一进步将对政治学、社会问题以及伦理道德的研究提供极大的支持。尽管其响应了更多的敏感话题,但在安全风险方面,MAI-DS-R1的有害内容降低了50%,展现出良好的安全控制能力。因此,渴望体验 “放飞自我” 版的用户可以尝试这一模型,探索新的可能性。

QQ_1744964462119.png

在模型的训练过程中,微软收集了约350,000个被屏蔽的主题示例,并筛选出相关的查询关键词。这些关键词被转化为多个问题并翻译成不同语言,进一步提升了模型的多语言适应性。此外,微软利用 DeepSeek R1及内部模型生成了相关问题的答案和思维链。训练数据还包括来自 Tulu3SFT 数据集的110,000个安全和违规示例,确保了模型在多种情况下的有效性。

经过全面评估,MAI-DS-R1在敏感话题的响应能力上表现出色,远超 DeepSeek R1及其衍生版本。在安全性评估中,MAI-DS-R1在 HarmBench 测试中表现不俗,显示出能够有效减少有害内容的能力,确保安全性和响应能力之间的良好平衡。

在推理能力方面,MAI-DS-R1与 DeepSeek R1保持一致,在常识、推理、数学和编程的基准测试中均表现优异。与此同时,该模型在处理不合法或不道德的请求时更加谨慎,拒绝生成任何有害或不当内容。

此外,MAI-DS-R1在后续的训练过程中将问题翻译成多种语言,使其能更好地满足国际组织、跨国企业及教育机构等多语言需求的场景。微软已在 huggingface 开源了该模型,并在 Azure AI Foundry 进行了发布,为广大用户提供了更多的选择。

huggingface:https://huggingface.co/microsoft/MAI-DS-R1

Azure地址:https://ai.azure.com/explore/models/MAI-DS-R1/version/1/registry/azureml

划重点:  

🌟 MAI-DS-R1的敏感话题响应能力提升至99.3%,是原版 R1的两倍多。  

🔒 安全风险大幅降低,有害内容减少50%,确保使用安全。  

🌍 多语言支持能力强,更适应国际组织和跨国企业的需求。

  • 相关推荐
  • 月之暗面放王炸!开源Kimi新模型:超新版DeepSeek R1全球第一

    月之暗面推出了针对软件工程任务的全新开源代码大模型Kimi-Dev-72B。 该模型在SWE-bench Verified编程基准测试中取得了全球最高开源模型水平,以仅72B的参数量,超越了刚发布不就、参数量达671B的新版DeepSeek-R1。

  • AI日报:阿里开源长文本深度思考模型QwenLong-L1;GPT-4o语音模式上线唱歌功能;秘塔AI搜索推出全新“极速”模型

    本文汇总了AI领域最新动态:1)中国信通院发布智能体开发标准,推动AI商业化进程;2)阿里推出QwenLong-L1-32B长文本推理模型,性能媲美Claude-3;3)GPT-4o语音模式升级,新增唱歌功能;4)秘塔AI搜索推出极速模型,响应速度达400tokens/秒;5)谷歌发布LMEval评估框架,统一大模型评测标准;6)Chrome浏览器集成Gemini AI助手;7)阿联酋全民免费使用ChatGPT Plus;8)苏州成立60亿元AI产业基金;9)法国Kyutai实验室推出10秒定制语音的Unmute系统;10)UAV-Flow项目实现无人机语音精准控制;11)Claude将升级支持百万字上下文和记忆功能;12)百度心响iOS版上线;13)夸克推出高考深度搜索功能;14)Chrome v137开发者工具升级;15)美团AI业务接近GPT-4o水平;16)Direct3D-S2实现3D生成速度提升10倍;17)OpenAI计划2026年推出首款AI硬件。

  • MiniMax深夜开源首个推理模型M1,这次是真的卷到DeepSeek了。

    ​不知道还有多少人记得,AI行业的六小虎。 行业内都在说,他们已经寂静好久了。 上一次相关的项目发布,还是前一段时间我写的MiniMax声音模型的更新,Speech-02。 而昨晚凌晨将近12点的时候,又是MiniMax,居然在X上,预告了他们一整周的发布计划。

  • 长生人寿积极响应战略,构建全链路智能服务体系

    长生人寿作为国内合资寿险企业代表,通过多元化资金运用模式支持科技创新、先进制造和绿色转型,2025年普惠保险已覆盖超50万客户群体。公司深度参与养老金融体系建设,推出覆盖长期护理、年金领取等全生命周期养老产品矩阵,长三角试点产品客户留存率达93%。数字化转型方面,构建"长生e点通"智能服务平台,集成AI视频核保等功能,并基于DeepSeek大模型开发智能展业助手"AI-长小生"。绿色金融方面成立专门委员会,2024年绿色投资规模显著增长,通过无纸化承保等举措实现碳排放强度下降。未来将持续深化"保险+科技+生态"战略布局,重点强化AI与区块链技术在精算定价等场景的应用,计划三年新增500亿元专项资金支持先进制造业集群培育。

  • 苹果全新AirTag即将推出:将有这几点提升

    近日,彭博社知名记者马克・古尔曼(Mark Gurman)在其《Power On》通讯中透露,传闻已久的苹果 AirTag2或已“基本准备就绪”,有望在近期与消费者见面。此前,古尔曼曾预测该产品将于2025年年中左右发布,而如今这一时间节点正逐步临近。 在通讯的问答环节中,古尔曼提到新款 AirTag 的筹备工作在过去几个月里一直在进行,但他同时表示,该产品的发布并不值得特别关注,在

  • DeepSeek更新R1推理AI模型,已发布Hugging Face

    更新后的 R1 拥有 6850 亿个参数,体量庞大。由于模型规模极大,普通消费者级别的硬件很可能无法直接运行。

  • 一句话搞定金融复杂工作,容联云大模型知识助理全新升级!

    容联云大模型知识助手全新升级,聚焦"更高效率、更懂金融、更好体验",推出实时语音问答与语音检索两大核心功能。升级亮点包括:1)秒级响应的实时语音问答,支持复杂金融政策解读和理财产品对比分析;2)语义穿透的实时语音检索,可精准定位海量金融文档关键信息,检索效率提升40%;3)深耕金融领域知识,深入理解业务逻辑,提供专业可靠支持;4)支持多音色切换,满足个性化需求。该助手已应用于内部管理、统数运营、营销增长和客户服务四大场景,显著提升业务效率,如客户咨询转化率提升30%、业务办理效率提升60%。

  • AI日报:腾讯混元3D 2.1大模型开源;字节跳动AI Lab负责人李航卸任;OpenAI Codex 全新升级

    本文介绍了AI领域最新动态:1)腾讯开源混元3D2.1大模型,提升3D生成质量;2)OpenAI Codex升级,优化代码生成功能;3)字节跳动AI Lab负责人李航卸任;4)微软发布700个AI应用案例;5)微软推出Code Researcher工具,解决58%系统崩溃问题;6)Observer AI实现屏幕操作自动化;7)Genspark发布AI浏览器;8)麻省理工用AI技术3.5小时修复15世纪名画;9)蚂蚁集团推出开源多模态GPT-4o模型Ming-Omni;10)MagicTryOn视频换衣框架;11)字节跳动发布实时互动AI视频生成模型Seaweed APT2;12)ChatGPT搜索功能升级;13)字节跳动与老凤祥合作开发AI智能眼镜。

  • 腾讯云入选Gartner®《如何建设实施网络检测与响应》报告全球代表厂商

    Gartner发布《如何建设实施网络检测与响应》报告,为安全技术人员提供NDR实施架构指导。报告提出结构化方法,包括准备阶段和三个实施步骤:1)架构设计;2)产品选型与POC评估;3)资源规划部署。腾讯云NDR凭借多层检测引擎、全流量分析建模等核心能力入选全球29家代表厂商。其产品具备检测场景全、响应快、阻断率高等优势,支持混合云部署,采用AI算法实现异常流量检测,并提供开放API集成能力。在2024年攻防演练中,腾讯云NDR成功帮助某大型银行阻断近20亿次攻击。

  • 权威眼科专家建议:技术防蓝光优先考虑激光电视,可有效降低近视风险

    中国青少年近视问题严峻,6亿近视人群居世界首位。专家指出户外活动少、电子设备使用频繁是主因。激光电视采用反射式成像原理,光线更柔和,能有效减少视力损伤。海信激光电视采用三色激光器实现0有害蓝光,配合纳米级光谱选择屏技术,既过滤有害光又保证画质。其1000nits高亮度配合环境光自适应功能,可降低视觉疲劳。618期间购买可享多重优惠,是家庭护眼的优选方案。

今日大家都在搜的词: