首页 > 业界 > 关键词  > 微软最新资讯  > 正文

微软在开发AI模型时泄露了38TB敏感数据

2023-09-19 10:08 · 稿源:站长之家

要点:

  • 微软在GitHub公共存储库上错误使用Azure平台的共享访问签名令牌(SAS),导致38TB的私人数据泄露,包括密码、密钥和内部消息。

  • SAS令牌的不当使用和缺乏监控以及管理,使得数据泄露风险增加,难以追踪。

  • 高度依赖大规模数据的AI模型训练过程需要更强的安全措施和协同工作,以防止类似的事件再次发生。

站长之家(ChinaZ.com) 9月19日 消息:微软近期的数据泄露事件凸显了AI模型训练过程中的安全风险和挑战。这一事件发生在GitHub公共存储库上,由于错误使用Azure平台的共享访问签名令牌(SAS),导致了38TB的私人数据泄露。

微软的AI研究人员通过一个权限过于宽松的SAS令牌在GitHub上分享文件,其中包括用于图像识别的开源代码和AI模型。然而,SAS令牌的危险在于缺乏监控和管理,因此难以追踪和控制。这使得微软的数据曝露了数年之久,严重威胁了数据的安全性。

网络安全 隐私 (4)

图源备注:图片由AI生成,图片授权服务商Midjourney

除了用于AI模型训练的数据,微软还泄露了两名员工工作站的磁盘备份,其中包括了“秘密”、私人加密密钥、密码以及属于359名微软员工的超过30,000条内部Microsoft Teams消息。总计有38TB的私人文件可能被任何人访问,直到微软于2023年6月24日吊销了危险的SAS令牌。

这次事件突显了SAS令牌的安全风险,因为它们缺乏监控和治理。Wiz指出,应尽量限制SAS令牌的使用,因为微软没有提供通过Azure门户进行集中管理的方式。

此外,SAS令牌可以配置为“实际上永久有效”,这使得难以追踪和控制其使用。首个微软提交到其AI GitHub存储库的令牌于2020年7月20日添加,有效期一直延续到2021年10月5日。随后又添加了第二个令牌,有效期设置为2051年10月6日。

总之,微软的这一多TB数据泄露事件凸显了AI模型训练的风险。这种新兴技术需要大规模的数据来进行训练,许多开发团队需要处理大量数据,与同行分享数据,或者参与公共开源项目的合作。然而,类似微软的事件变得越来越难以监控和避免,因此需要更强的安全措施和协同工作来确保数据的安全性和隐私保护。

举报

  • 相关推荐
  • 微软AI亚太总裁张祺新书发布 《OPE一人即系统》解读智能时代全新创业范式

    近日,北京大学出版社主办的《OPE一人即系统——AI时代的单人创业家新范式》新书发布会暨智能时代圆桌论坛在京举行。该书由微软全球资深副总裁张祺博士提出并系统阐释“OPE(单人创业家)”理念,强调在生成式AI与智能体赋能下,个体正成为能调度工具与全球资源的“最小创新系统”。活动围绕“智能体时代、未来组织与数字劳动动力系统”展开讨论,与会嘉宾一致认�

  • NVIDIA 携手微软,在个人 AI 时代重塑 Windows PC

    NVIDIA发布RTX Spark超级芯片,专为个人AI智能体打造Windows PC,具备1 Petaflop AI性能、128GB统一内存及完整CUDA与RTX生态。与微软合作提供安全原生体验,支持创作者、开发者和游戏玩家处理90GB以上3D场景、12K视频编辑、运行120B参数大模型及1440p超100FPS游戏。华硕、戴尔、惠普、联想等OEM将于今年秋季推出轻薄笔记本。

  • 小米超高端手机下半年发布:玄戒芯片+OS+AI大模型大会师!全自研

    小米将于下半年发布一款超高端新品,属于MIX系列,可能命名为MIX Fold 5,搭载自研玄戒O3旗舰SoC(3nm制程、超大核4.05Ghz等)、澎湃OS 4系统(底层重构提升流畅度)和自研MiMo大模型(MiMo-V2.5系列全球领先)。该产品并非小米17S Pro,而是新一代大折叠屏手机,此外MIX系列还规划了一款直板机,带模块化磁吸镜头量产方案,两款机型预计Q3发布,最快7月亮相。

  • 每日互动打造AI PC个知·智能工作站 内置300亿参数小模型平衡安全与成本

    2026年台北GTC大会上,黄仁勋指出PC使用方式将因RTX Spark超级芯片和Windows改变,用户只需提问即可完成工作,“AI PC”成为必然趋势。文章强调消费级与企业级AI PC的区别,后者需解决数据主权、私有化部署和成本可控问题。每日互动推出的“个知·智能工作站”采用“云边端库”架构,通过端侧模型与云侧大模型协同,实现本地数据安全处理。该工作站内置300亿参数大语言模型�

  • 模型即审美:生图模型们正建起自己的“视觉方言”

    ​最近在测试各种AI生图模型的时候,我们发现了一个现象:同样一个提示词,丢给不同的模型,出来的图片风格差异大到像是出自不同摄影流派。 Image-2生成的图就像我昨天随手拍的,但Nano Banana生成的图感觉像某个家居品牌的广告大片。有些模型执着于捕捉现实的每一丝瑕疵,有些则痴迷于把日常场景变成精致的艺术品。这背后反映的不是能力差别,而是每个模型对"什么

  • AI日报:MiniMax发布M3 大模型;英伟达物理大模型Cosmos3发布;小红书已治理超120万个AI托管账号

    今日AI领域动态丰富:MiniMax发布M3+大模型,首创MSA架构并支持1M上下文,全面开源对标海外旗舰;英伟达联合行业巨头发布全球首款全开源全模态物理AI大模型Cosmos3,成立宇宙联盟;千问APP六一期间礼品选购咨询量增长260%,展现AI购物潜力;小红书治理超120万AI托管账号,处置18万篇AI造假笔记;抖音4月新增AI短剧超4.4万部,但爆款率仅0.6%;胡彦斌上线粉丝社区应用“彦火”,展示Vibe Coding潜力;LobsterAI推出图片视频大模型矩阵,整合四大主流模型;OpenAI重启机器人业务,奥特曼公开招募工程师,拓展具身智能布局。

  • Check Point发布智能体暴露验证功能,主动应对AI模型自主漏洞利用威胁

    Check Point发布全新AI智能体“暴露验证(AEV)”,以攻击者视角推理验证真实可利用漏洞,帮助安全团队在攻击前采取行动。该功能利用前沿AI模型自主发现和利用漏洞,结合威胁情报上下文,从外部审视企业数字暴露面,摒弃静态严重性评分,通过安全验证闭环分析资产、CVE漏洞及现有控制措施,生成针对性验证路径。AEV是持续威胁暴露管理(CTEM)体系的关键验证能力,已为数十个漏洞生成新利用路径,现已正式上线。

  • 全球AI大模型周调用量五连涨 DeepSeek-V4-Flash登顶

    根据OpenRouter最新数据测算,上周(5月18日至5月24日),全球AI大模型总调用量达28.9万亿Token,较此前一周增长7.4%,连续五周上涨,大模型调用需求仍在持续释放。 在主要上榜模型中,中国AI大模型周调用量达9.223万亿Token,环比增长19.89%;同期美国AI大模型周调用量为4.93万亿Token,环比增长16.27%。中国大模型周调用量已连续四周超过美国,稳居全球首位,表明中国模型正更深入

  • AI日报:阿里上线首个官方大模型NBA Chat; Ideogram4.0开源发布;OpenAI升级ChatGPT记忆系统

    今日AI领域动态:Ideogram 4.0开源发布,93亿参数打造最强文字生成AI,提升海报与品牌营销创作;OpenAI升级ChatGPT记忆系统,算力降至1/5,解决过时与准确性痛点;腾讯文档推出行业首创“人机双写”原生编辑器;xAI发布Grok Imagine Video 1.5,支持图片转视频;豆包回应AI识别野生蘑菇误判,强调仅供参考;知乎Q1扭亏为盈,AI短剧成增长点;腾讯云ADP 4.0新增Claw模式,提升企业Agent构建效率;NBA中国与阿里推出首个官方大模型“NBA Chat”。

  • 谷歌推出Gemini Go:2GB内存手机也能跑大模型

    谷歌为Android Go系统推出全新Gemini Go AI助手,专为内存超2GB的低配设备设计。该精简版大模型取代Google Assistant Go,用户无需下载独立应用,长按Home键或电源键即可唤醒。它支持拨打电话、发短信、查询地图、搜索餐厅、设置闹钟等日常功能,还能上传文档和照片以提供更自然的对话体验。目前,Gemini Go已开始分阶段向符合条件的设备推送。

今日大家都在搜的词: