首页 > AI头条  > 正文

微软全新开源模型 MAI-DS-R1:敏感话题响应提升,安全风险降低

2025-04-18 16:21 · 来源: AIbase基地

微软在其官网上正式开源了 DeepSeek-R1的魔改版 ——MAI-DS-R1。这一新模型在保留原有推理性能的基础上,进行了显著的增强,尤其在对敏感话题的响应能力上取得了巨大的突破。

QQ_1744964448252.png

MAI-DS-R1的响应能力达到了99.3%,是原版 R1的两倍多。这一进步将对政治学、社会问题以及伦理道德的研究提供极大的支持。尽管其响应了更多的敏感话题,但在安全风险方面,MAI-DS-R1的有害内容降低了50%,展现出良好的安全控制能力。因此,渴望体验 “放飞自我” 版的用户可以尝试这一模型,探索新的可能性。

QQ_1744964462119.png

在模型的训练过程中,微软收集了约350,000个被屏蔽的主题示例,并筛选出相关的查询关键词。这些关键词被转化为多个问题并翻译成不同语言,进一步提升了模型的多语言适应性。此外,微软利用 DeepSeek R1及内部模型生成了相关问题的答案和思维链。训练数据还包括来自 Tulu3SFT 数据集的110,000个安全和违规示例,确保了模型在多种情况下的有效性。

经过全面评估,MAI-DS-R1在敏感话题的响应能力上表现出色,远超 DeepSeek R1及其衍生版本。在安全性评估中,MAI-DS-R1在 HarmBench 测试中表现不俗,显示出能够有效减少有害内容的能力,确保安全性和响应能力之间的良好平衡。

在推理能力方面,MAI-DS-R1与 DeepSeek R1保持一致,在常识、推理、数学和编程的基准测试中均表现优异。与此同时,该模型在处理不合法或不道德的请求时更加谨慎,拒绝生成任何有害或不当内容。

此外,MAI-DS-R1在后续的训练过程中将问题翻译成多种语言,使其能更好地满足国际组织、跨国企业及教育机构等多语言需求的场景。微软已在 huggingface 开源了该模型,并在 Azure AI Foundry 进行了发布,为广大用户提供了更多的选择。

huggingface:https://huggingface.co/microsoft/MAI-DS-R1

Azure地址:https://ai.azure.com/explore/models/MAI-DS-R1/version/1/registry/azureml

划重点:  

🌟 MAI-DS-R1的敏感话题响应能力提升至99.3%,是原版 R1的两倍多。  

🔒 安全风险大幅降低,有害内容减少50%,确保使用安全。  

🌍 多语言支持能力强,更适应国际组织和跨国企业的需求。

  • 相关推荐
  • 中国智力持续发力,智象未来开源模型再获国际认可

    国内AI企业智象未来研发的开源图像生成模型HiDream-I1近日取得重要突破:该模型凭借17B参数规模,在图像真实感、细节处理及指令响应能力上超越行业标杆,多项评测指标超过GPT-4o与Flux1.1。继登顶AI基准测试平台Artificial Analysis、获Hugging Face收录后,该模型正式被谷歌技术生态体系收录,成为首个登顶该平台榜首的中国自研开源模型。其24小时内登顶的纪录,被视为中国AI技术全球竞争力的重要里程碑。谷歌的收录将推动HiDream-I1触达全球开发者,助力开源生态共建进入新发展阶段。

  • 阿里千问3登顶球最强开源模型 已在通义App上线

    阿里集团推出新一代开源AI模型"通义千问3"(Qwen3),包含8款不同规格的混合推理模型。旗舰型号Qwen3-235B采用混合专家架构,创下国产模型性能新纪录;Qwen3-32B则以部署成本低、运行稳定见长。该系列在逻辑推理、编程、翻译等专业领域表现卓越,用户可通过通义App和网页版体验。升级后的通义App整合问答对话、图像理解与生成等多项功能,持续强化代码生成、数学解题等专业场景应用能力,致力于打造实用性强的个人AI助手。

  • 安徽高速回应提醒慎用辅助驾驶提示:安第一

    近日,有网友在社交媒体分享称,途经安徽高速时发现道路警示牌显示慎用辅助驾驶”。从网传内容看,安徽段高速公路的警示标改为了高速路况复杂,慎用辅助驾驶”,此外还有勿用智能辅助驾驶”、高速上有些施工路段已经明确要求关闭智能驾驶了”、前方占道施工,关闭辅助驾驶”等标语。并且需要提醒的是,当前辅助驾驶第一责任人依旧是驾驶员本人,用户在使用智驾时,需要实时关注路况,并随时接管。

  • 秒杀同行!Kimi开源全新音频基础模型,横扫十多项基准测试,总体性能第一

    Kimi-Audio是一款开源的通用音频基础模型,在语音识别、音频理解、音频转文本、语音对话等任务中表现优异。该模型采用集成式架构设计,包含音频分词器、音频大模型和音频去分词器三大核心组件,支持多模态输入处理。在十余项音频基准测试中,Kimi-Audio均取得领先性能,如LibriSpeech ASR测试WER仅1.28%,VocalSound测试达94.85%。模型使用1300万小时多语言音频数据进行预训练,并构建了自动处理流水线生成高质量训练数据。评估结果显示,Kimi-Audio在语音识别、音乐理解、语音情感分析等任务上全面超越同类模型,在OpenAudioBench和VoiceBench对话测试中也表现最佳。目前模型代码、检查点和评估工具包已在GitHub开源。

  • 能理解海豚声音!谷歌开发全新AI模型DolphinGemma

    快科技4月15日消息,谷歌公布了一款名为DolphinGemma”的大型语言模型,旨在帮助科学家理解海豚的声音,并生成类似海豚的声音序列。研究人员预计在未来几个月内测试DolphinGemma及其配套的Cetacean Hearing Augmentation Telemetry(CHAT)发声系统,以探索是否能够翻译并模仿海豚的声音,进而实现与海豚的某种对话”。海豚是地球上最聪明且最善于沟通的动物之一,其社交互动极其复杂�

  • 奥特曼:ChatGPT不是AGI!OpenAI最强开源模型直击DeepSeek

    【新智元导读】代码截图泄露,满血版o3、o4-mini锁定下周!更劲爆的是,一款据称是OpenAI的神秘模型一夜爆红,每日处理高达260亿token,是Claude用量4倍。奥特曼在TED放话:将推超强开源模型,直面DeepSeek挑战。持续的创新、丰富的资源和智能AI将会无缝融入日常生活,未来一代人将会觉得当前人们又辛苦又落后。

  • 1000万上下文!新开源多模态大模型,单个GPU就能运行

    今年2月初,谷歌发布的Gemini2.0Pro支持200万上下文,震惊了整个大模型领域。仅过了2个月,Meta最新开源的Llama4Scout就将上下文扩展至1000万,整整提升了5倍开启千万级时代。根据实验数据显示,Llama4Behemoth在MMLUPro、GPQA、MATH-500等测试的数据比GPT-4.5、ClaudeSonnet3.7、Gemini2.0Pro更好。

  • 媲美OpenAI-o3,刚刚开源模型DeepCoder,训练方法、数据集大公开

    今天凌晨4点,著名大模型训练平台TogetherAI和智能体平台Agentica,联合开源了新模型DeepCoder-14B-Preview。该模型只有140亿参数,但在知名代码测试平台LiveCodeBench的测试分为60.6%,高于OpenAI的o1模型,略低于o3-mini。TogetherAI刚获得3.05亿美元的B轮融资,其估值也从去年的12.5亿美元翻倍至33亿美元。

  • 微软上线GPT-image-1模型 通过API向开发者开放使用

    OpenAI于4月24日发布全新图像生成模型GPT-image-1,通过API向全球开发者开放。该模型支持生成高质量图像,具备多级定制功能,包括控制敏感度、生成效率、背景、输出格式等参数,并推出"吉卜力模式"生成独特风格图像。Adobe、Figma等多家企业已将其集成到产品中。API定价按token计算,低质量图像生成成本约0.02美元/张。OpenAI CEO Sam Altman高度评价该模型,认为其为开发者带来更大创意空间。

  • AI日报:Kimi全新音频基础模型Kimi-Audio;阶跃星辰开源图像编辑模型Step1X-Edit;​夸克AI超级框上线 “拍照问夸克”

    本期AI日报聚焦多项AI技术突破与应用:1)Moonshot AI推出开源音频模型Kimi-Audio,基于13亿小时训练数据,支持语音识别等任务;2)阶跃星辰开源图像编辑模型Step1X-Edit,展现强大生成能力;3)夸克AI上线"拍照问夸克"功能,实现视觉问答;4)苹果iOS18.5将在中国推送,带来智能功能;5)谷歌发布601个生成式AI应用案例,覆盖多行业;6)微软推出深度整合Windows的UFO²自动化系统;7)OpenAI升级ChatGPT至GPT-4o版本,提升STEM领域能力;8)Ema公司推出高性价比语言模型EmaFusion;9)Liquid AI发布面向边缘设备的Hyena Edge模型;10)LemonAI推出实时音视频数字人产品Slice Live。此外,国内方面,智谱与生数科技达成战略合作推动大模型发展,宝马中国宣布新车将接入DeepSeek技术。

今日大家都在搜的词:

热文

  • 3 天
  • 7天