首页 > 业界 > 关键词  > 微软最新资讯  > 正文

微软在开发AI模型时泄露了38TB敏感数据

2023-09-19 10:08 · 稿源:站长之家

要点:

  • 微软在GitHub公共存储库上错误使用Azure平台的共享访问签名令牌(SAS),导致38TB的私人数据泄露,包括密码、密钥和内部消息。

  • SAS令牌的不当使用和缺乏监控以及管理,使得数据泄露风险增加,难以追踪。

  • 高度依赖大规模数据的AI模型训练过程需要更强的安全措施和协同工作,以防止类似的事件再次发生。

站长之家(ChinaZ.com) 9月19日 消息:微软近期的数据泄露事件凸显了AI模型训练过程中的安全风险和挑战。这一事件发生在GitHub公共存储库上,由于错误使用Azure平台的共享访问签名令牌(SAS),导致了38TB的私人数据泄露。

微软的AI研究人员通过一个权限过于宽松的SAS令牌在GitHub上分享文件,其中包括用于图像识别的开源代码和AI模型。然而,SAS令牌的危险在于缺乏监控和管理,因此难以追踪和控制。这使得微软的数据曝露了数年之久,严重威胁了数据的安全性。

网络安全 隐私 (4)

图源备注:图片由AI生成,图片授权服务商Midjourney

除了用于AI模型训练的数据,微软还泄露了两名员工工作站的磁盘备份,其中包括了“秘密”、私人加密密钥、密码以及属于359名微软员工的超过30,000条内部Microsoft Teams消息。总计有38TB的私人文件可能被任何人访问,直到微软于2023年6月24日吊销了危险的SAS令牌。

这次事件突显了SAS令牌的安全风险,因为它们缺乏监控和治理。Wiz指出,应尽量限制SAS令牌的使用,因为微软没有提供通过Azure门户进行集中管理的方式。

此外,SAS令牌可以配置为“实际上永久有效”,这使得难以追踪和控制其使用。首个微软提交到其AI GitHub存储库的令牌于2020年7月20日添加,有效期一直延续到2021年10月5日。随后又添加了第二个令牌,有效期设置为2051年10月6日。

总之,微软的这一多TB数据泄露事件凸显了AI模型训练的风险。这种新兴技术需要大规模的数据来进行训练,许多开发团队需要处理大量数据,与同行分享数据,或者参与公共开源项目的合作。然而,类似微软的事件变得越来越难以监控和避免,因此需要更强的安全措施和协同工作来确保数据的安全性和隐私保护。

举报

  • 相关推荐
  • GPTBots 迎来增强版 DeepSeek-R1-0528 模型

    GPTBots.ai平台宣布集成深度求索(DeepSeek)最新开源模型DeepSeek-R1-0528,该模型在推理能力上媲美OpenAI和Google的顶级模型,性能显著提升:数学竞赛准确率从70%提升至87.5%,编程性能从63.5%提升至73.3%。该模型支持JSON输出与函数调用,可无缝嵌入企业工作流,同时推出轻量级版本DeepSeek-R1-0528-Qwen3-8B,仅需16GB GPU内存即可运行。此次集成将强化GPTBots为企业提供金融、医疗、教育等领域的AI解决方案能力,助力企业构建定制化AI应用。平台秉持开源理念,采用MIT许可协议,支持商业使用与定制开发。

  • 3800亿元押注AI基建后,阿里交出一份答卷

    2025年5月15日,阿里巴巴集团(以下简称“阿里”)公布2025财年Q4财报(2025年1月—2025年3月)及2025财年全年(2024年4月—2025年的3月)财报。 这一季度,阿里营收2364.5亿元,同比增长7%;净利润298.47亿元,同比增长22%。同时,阿里在2025财年全年营收为9963.47亿元,同比增长6%;净利润为1581.22亿元。

  • AI日报:通义千问开源Qwen3向量模型;字节跳动图像编辑模型SeedEdit 3.0;ElevenLabs推v3语音模型

    本文汇总了近期AI领域的重要动态:1)通义千问发布Qwen3-Embedding系列模型,在多语言文本处理表现优异;2)字节跳动推出图像编辑模型SeedEdit3.0,提升细节保持能力;3)ElevenLabs发布情感语音合成系统Eleven v3 Alpha;4)Anthropic推出面向国家安全的Claude Gov模型;5)可灵AI月收入连续两月超1亿元;6)Meta公布智能眼镜Aria Gen2技术细节;7)爱诗科技上线AI视频工具"拍我AI";8)富国银行预测2030年ChatGPT广告收入将达千亿美元。

  • 彭博社聚焦Coinbase数据泄露,CertiK联创顾荣辉警示私钥风险与物理攻击

    CertiK联合创始人顾荣辉就Coinbase数据泄露事件指出,加密货币交易者因私钥即可转移资产且难以追回,成为犯罪分子的首要目标。区块链安全虽提升,但攻击者转向物理威胁等薄弱环节。钓鱼攻击去年造成10.5亿美元损失,显示攻击方式从技术漏洞转向高回报手段。法国政府已为加密从业者开通应急热线,并建议结合链上防御、数据隐私与物理安防措施应对数字与实体交织的威胁。近期Coinbase数据泄露及法国绑架案凸显加密投资者面临的物理安全风险,部分公司已加强高管安保投入。专家呼吁建立更广泛的安全协作网络应对持续演变的攻防博弈。

  • AI日报:豆包大模型1.6发布;OpenAI推o3-pro模型、o3价格暴降80%;Figma官方MCP重磅上线

    【AI日报】今日AI领域重要动态:1)火山引擎发布豆包大模型1.6和视频生成模型Seedance1.0pro,性能显著提升;2)OpenAI推出o3-pro模型,专注可靠性但响应较慢;3)Figma推出Dev Mode MCP服务,实现设计到代码一键转换;4)Krea AI发布图像生成模型Krea1,解决传统AI绘图问题;5)火山引擎豆包日调用量突破16.4万亿次;6)法国Mistral发布推理模型Magistral;7)苹果系统整合ChatGPT图像生成功能;8)OpenAI大幅下调o3价格80%并推出o3-pro;9)Hugging Face开源榜单显示中国团队Qwen与DeepSeek进入全球前15;10)阿里开源MaskSearch框架,提升AI解决复杂问题能力。

  • 发布AI Agent开发平台,做强AI生态… 网易数智接下来这么干

    AI时代正从AIGC转向AI Agent发展。微软CEO纳德拉预测AI Agent将成为新应用,Gartner预计到2028年超1/3企业软件将集成AI Agent功能。网易数智发布CoreAgent智能体开发平台及多款行业智能体,助力企业快速落地AI应用。文章指出当前AI Agent面临技术门槛高、场景适配难等挑战,网易提出"技术共生、市场共拓、利润共享"的生态协同理念,强调AI需要与行业know-how结合才能创造真实价值。网易数智宣布品牌升级,从"科技蓝"变为"网易红",展现拥抱AI时代的决心。

  • AI日报:谷歌推最强AI全家桶Google AI Ultra;腾讯混元宣布模型矩阵全面升级;豆包·语音播客模型发布

    本文汇总了近期AI领域的重要动态:1)谷歌推出249.99美元/月的AI Ultra订阅计划,提供最强AI模型和高级功能;2)腾讯混元模型升级,新增视觉推理T1-Vision和语音对话模型;3)美图获阿里2.5亿美元投资,将在电商和AI领域合作;4)豆包推出语音播客模型,实现文本快速转音频;5)百度文心X1 Turbo获信通院最高评级;6)谷歌发布Flow AI剪辑工具,集成Veo3等三大模型;7)谷歌Veo3支持4K视频生成;8)Imagen4图像模型发布;9)Gemini2.5 Pro新增并行推理功能;10)谷歌推出虚拟试衣工具;11)公测AI编程助手Jules;12)苹果计划在iOS19开放AI模型;13)京东云推五大免费AI营销工具;14)字节开源多模态模型BAGEL;15)英伟达发布物理推理模型Cosmos-Reason1。

  • 一场文心大模型的「AI马拉松」

    对于百度而言,既要保持长期主义的战略定力,也要在技术路径上灵活应变,这种「变与不变」的平衡或许正是其在这轮科技革命中的制胜之道。 2025年,模型能力的重要性依然无需多言。 从预训练的角度来看,虽然连 OpenAI 前首席科学家 Ilya Sutskever 都说,预训练数据即将用尽,但海量的图像、视频等多模态数据资源依然有待挖掘。 从后训练的角度来看,强化学习新范式正�

  • 女子想见已故男友被“法师”骗38万 法院:构成诈骗罪

    2023年10月,女子刘某因难以走出意外去世前男友的伤痛,在一个“法术交流微信群”内发出求助信息,希望能与前男友“再相见”。被告人麦某强看到该信息后,在群内吹嘘自己曾成功实施过相关“法术”。刘某看到后,添加了麦某强的微信进行咨询。 在交流过程中,麦某强谎称自己是“法师”,还刻意将自己包装成淡泊名利的形象,以此获取刘某的信任。此后,刘某经常通

  • Anthropic首席执行官:AI 模型的“幻觉”比人类少!

    Anthropic 首席执行官达里奥·阿莫代伊(Dario Amodei)表示,他认为当前的 AI 模型出现“幻觉”(即编造虚假事实并将其当作真实信息呈现)的频率,比人类还要低……