首页 > AI头条  > 正文

DeepSeek可能使用了Google Gemini数据训练新 AI 模型

2025-06-04 09:48 · 来源: AIbase基地

近日, DeepSeek 发布了其最新的 R1推理 AI 模型更新版,该模型在多个数学和编程基准测试中展现出色性能。然而,DeepSeek 并未透露其模型的训练数据来源,令一些 AI 研究人员产生了疑问,并推测该模型可能部分基于 Google 的 Gemini AI 系列进行训练。

墨尔本的开发者 Sam Paeach 声称,他发现 DeepSeek 的 R1-0528模型在用词和表达方式上与 Google Gemini2.5Pro 有许多相似之处。虽然这并不能作为直接证据,但另一位开发者 —— 匿名的 SpeechMap 项目创始人 —— 也提到,DeepSeek 模型在推理过程中产生的 “思维轨迹” 与 Gemini 的表现如出一辙。这一发现再次引发了关于 DeepSeek 是否在训练中使用了竞争对手数据的讨论。

DeepSeek

图源备注:图片由AI生成,图片授权服务商Midjourney

早在去年12月,DeepSeek 就曾因其 V3模型频繁将自己标识为 OpenAI 的 ChatGPT 而受到指责,这一行为暗示该模型可能是通过 ChatGPT 的聊天记录进行训练的。今年早些时候,OpenAI 向媒体透露,发现了 DeepSeek 与 “数据蒸馏” 技术相关的证据。“数据蒸馏” 是一种通过从大型模型中提取信息来训练新模型的方法。彭博社报道称,OpenAI 的合作伙伴微软在2024年底发现,很多数据是通过 OpenAI 开发者账户泄露的,这些账户可能与 DeepSeek 有关。

尽管 “提炼” 技术在 AI 界并不罕见,但 OpenAI 明确规定禁止用户使用其模型输出构建竞争产品。需要注意的是,由于开放网络中充斥着大量低质量内容,许多 AI 模型在训练中往往会错误地模仿彼此的用词和措辞。这使得深度剖析训练数据源变得更加复杂。

人工智能专家 Nathan Lambert 认为,DeepSeek 使用 Google Gemini 的数据进行训练并非不可能。他提到,DeepSeek 拥有充足的资金,能够利用市面上最佳的 API 模型生成合成数据。为了防止数据被提炼,AI 公司们也在不断加强安全措施。例如,OpenAI 已开始要求各组织完成身份验证才能访问某些高级模型,而 Google 也在努力提高其 AI Studio 平台的安全性,限制对模型生成轨迹的访问。

  • 相关推荐
  • DeepSeek更新R1推理AI模型,已发布Hugging Face

    更新后的 R1 拥有 6850 亿个参数,体量庞大。由于模型规模极大,普通消费者级别的硬件很可能无法直接运行。

  • 初中老师如何用deepseek 和 Kimi无痛做课件

    本教程指导初中教师如何利用Deepseek和Kimi两款AI工具高效完成备课全流程。Deepseek用于生成教学设计方案和PPT大纲,Kimi则根据大纲快速生成精美课件。操作步骤:1)在Deepseek输入教学需求生成教学设计;2)用Deepseek生成PPT大纲;3)将大纲粘贴至Kimi PPT助手一键生成课件。该方法特别适合日常备课、临时调课需求,能大幅提升备课效率,让教师既省时又高效。

  • 如何用 DeepSeek 进行合同审核

    本文介绍如何利用DeepSeek AI工具高效审核合同法律风险。合同是商业活动的重要保障,但隐藏的法律风险可能带来巨大损失。DeepSeek能快速识别合同条款中的合法性存疑、违约责任模糊、交付条款不清等问题,并提供专业修改建议。操作流程包括:1.登录DeepSeek平台;2.上传合同文件;3.输入审核指令;4.查看详细审核结果。该工具适用于企业法务、律师及商务人员,能有效规避合同风险,提高审核效率。

  • 利用DeepSeek和豆包生成工作总结

    本文介绍如何利用AI工具快速撰写高质量工作总结。通过DeepSeek生成内容框架,再使用豆包填充具体内容,可大幅提升写作效率。操作步骤:1)在DeepSeek输入需求获取大纲;2)将大纲粘贴至豆包生成详细内容;3)根据需要进行调整优化。该方法适用于教师学期总结、员工季度报告、项目总结等多种场景,能有效节省时间精力,提升工作效率。

  • DeepSeek徒手造一个能对话的AI简历,助你当场拿下Offer。

    ​故事是这样的。 我最近一直在招人,想招点人帮我分担一些压力,全职的实习的啥的都可以。 我这再怎么说,也是一个跟AI有关的地方,所以很多人在投简历的时候,都会写很多跟AI相关的经历,我甚至收到过很多AI生成的简历。 很多写的很玄乎,什么掌握全链路工作流,独立搭建xx系统,深度参与xx项目,掌握xx行业资源等等,但是一面,问用过最惊艳的AI产品是啥,10个�

  • AI简历教程!用 deepseek 一键生成高质量简历

    本文介绍如何利用AI工具Deepseek快速制作专业简历。传统简历制作依赖WPS模板或作图软件,过程繁琐。现在通过Deepseek平台,只需输入自然语言指令(如工作经验、技能等关键信息),系统即可自动生成排版精美的HTML版简历,还能转换为PDF格式。操作流程分三步:1.访问官网输入需求指令;2.查看并运行生成的HTML代码;3.保存文件或转为PDF。该工具特别适合求职者快速制作突出个人优势的专业简历,大幅提升求职效率。

  • 如何用 DeepSeek 生成特定结构会议纪要

    本文介绍如何利用DeepSeek AI高效整理会议纪要。主要步骤包括:1)会议录音转文字(推荐使用"录咖"工具);2)登录DeepSeek官网输入指令,要求将会议记录按"决策事项/待办事项/风险预警"三部分结构化整理;3)检查优化生成的会议纪要。该方法能快速将杂乱会议内容转化为清晰文档,突出关键信息,提升工作效率。文中提供了具体操作流程和工具链接。

  • 如何使用 DeepSeek 生成商务谈判话术

    本文介绍如何利用DeepSeek AI工具在商务谈判中应对供应商压价。DeepSeek作为免费AI工具,可快速生成实用的谈判话术模板。操作流程包括:1.访问官网输入指令"模拟供应商压价场景,提供3种应对策略及话术模板";2.获取系统生成的3种专业应对方案。该工具能有效提升谈判效率,满足日常商务沟通需求,特别适合采购谈判场景使用。

  • 华为:让DeepSeek的“专家们”动起来,推理延迟降10%!

    要问最近哪个模型最火,混合专家模型(MoE,Mixture of Experts)绝对是榜上提名的那一个。 它的巧妙之处,就在于把不同的任务分配给擅长处理的专家网络,让整个系统性能得以提升。 但你知道吗? 正是这个关键的专家网络,也是严重影响系统推理性能的因素之一。 因为在大量任务来临之际(尤其是超大规模时),MoE并不是以“雨露均沾”的方式去分配——专家网络们的负�

  • DeepSeek + Kimi一键生成高质量PPT

    文章介绍如何用两个免费AI工具快速制作PPT:先用微信版DeepSeek生成大纲,再用Kimi智能助手一键生成PPT。操作步骤包括:1)在微信搜索DeepSeek,输入需求生成结构化大纲;2)访问Kimi网页版,将大纲粘贴至PPT助手功能;3)选择模板样式,一键生成PPT。该方法适用于教师备课、学生汇报、职场报告等多种场景,能自动完成从构思到排版的全部流程,高效且效果惊艳。

今日大家都在搜的词: