首页 > 业界 > 关键词  > 斯坦福最新资讯  > 正文

斯坦福回应抄袭清华系大模型 公开道歉并删除推文

2024-06-04 16:40 · 稿源:站长之家

斯坦福大学的一个AI团队在 5 月 29 日发布了一个名为Llama3-V的多模态大模型,并宣称只需 500 美元就能训练出一个性能与GPT4-V相媲美的模型。然而,该模型随后被指控抄袭,与国内由面壁智能和清华大学自然语言处理实验室联合推出的大模型MiniCPM-Llama3-V 2. 5 存在极高的相似度。

面壁智能的CEO李大海和联合创始人刘知远对此事件先后发表回应,认为尽管这在某种程度上可以看作是他们成果得到了国际团队的认可,但他们更希望建立一个开放、合作、有信任的社区环境。目前,斯坦福的团队已经公开道歉,并删除了相关库和官宣推文。

Llama3-V模型在社交媒体上迅速走红,并一度登上了HuggingFace趋势榜首页。但随后,一名网友发现Llama3-V与MiniCPM-Llama3-V 2. 5 在结构、代码、配置文件上几乎一模一样,仅有变量名被替换。网友在面壁智能GitHub的项目下展示了一系列证据。

刘知远教授在知乎上回应称,MiniCPM-Llama3-V 2. 5 在研发时内置了一个彩蛋,即对“清华简”的识别能力,而Llama3-V模型也展现出了一模一样的能力。清华简是清华大学收藏的一批战国竹简,为战国中晚期文物。刘知远透露,识别清华简是MiniCPM-Llama3-V 2. 5 的一项实验功能,训练图像是最近从出土文物中扫描并标注的,且尚未公开发布。

遭到质疑后,斯坦福团队成员删除了官宣模型的推文,并将项目在Github和HuggingFace上的库一并删除。团队成员森德哈斯·沙玛(Siddharth Sharma)和阿克沙·加格(Aksh Garg)在社交平台上向面壁MiniCPM团队正式道歉,并表示会将Llama3-V模型撤下。

李大海在声明中表达了对此事的深切遗憾,并强调应该构建一个开放、协作且充满信任的技术社区环境。他们希望团队的努力和优秀工作能够吸引更多人的关注和认可,但并非以被模仿或抄袭的方式。

斯坦福人工智能实验室主任克里斯托弗·大卫·曼宁(Christopher David Manning)也发文谴责这一抄袭行为。

面壁智能首席科学家刘知远表示,人工智能的飞速发展离不开全球算法、数据与模型的开源共享,让人们始终可以站在SOTA的肩上持续前进。开源共享的基石是对开源协议的遵守,对其他贡献者的信任,对前人成果的尊重和致敬,Llama3-V团队无疑严重破坏了这一点。

面壁智能成立于 2022 年 8 月,由李大海担任CEO,曾国洋为法定代表人,注册资本约52. 46 万人民币。公司已完成两轮融资,由知乎、智谱AI等投资。李大海毕业于北京大学数学系,曾任Google中国创始员工之一,后在知乎担任合伙人、CTO。刘知远是清华大学计算机系长聘副教授,智源青年科学家,主要研究方向为自然语言处理、知识图谱和社会计算。

举报

  • 相关推荐
  • 对标斯坦福!曹德旺:福耀科技大学将是中国科学家摇篮

    今年2月,由玻璃大王”、福耀集团董事长曹德旺捐100亿设立的福建福耀科技大学正式获批,并宣布王树国任校长。日前,曹德旺、王树国在《对话》节目中回应了为什么要建立大学?学校已初步荟聚了一支高水平国际化的师资队伍,包括海内外院士15人,全球前2%顶尖科学家56人,国家级高层次人才80人,具有境外教育背景或教科研经历教师占比71.2%。

  • 曹德旺捐100亿元建立 对标斯坦福!福耀科技大学领导班子亮相

    今年2月,玻璃大王”曹德旺捐100亿设立的福建福耀科技大学正式获批,同时官宣王树国任校长。曹德旺此前曾表示,福耀科技大学目标就是要对标斯坦福大学。陈建群是南京大学理学学士、硕士,法国国家应用科学学院博士,曾任南京大学生命科学学院教授、博士生导师,南京大学校长助理、金陵学院院长等职。

  • 阿丘科技李嘉悦:大模型驱动的AI检测范式变革——大模型、小模型、智能体的协同进化

    3月28日,由机器视觉产业联盟主办、慕尼黑展览有限公司承办的VisionChina2025机器视觉展在上海新国际博览中心圆满落幕。阿丘科技产品总监李嘉悦在机器视觉及工业应用研讨会现场,围绕“大模型驱动的AI检测范式变革:大模型、小模型与智能体的协同进化”的主题,发表了精彩演讲。”今年,在这个快速变化的时代,我要补充一句:“AI工业视觉的格局正在加速变革,不会用大模型的将会被善用大模型的人淘汰。

  • 合合信息发布“大模型加速器 2.0”,助力大模型跨越“幻觉”障碍

    近日,上海合合信息科技股份有限公司(简称“合合信息”)TextIn“大模型加速器 2.0”版本正式上线,凭借其多维度升级,为降低大模型“幻觉”风险、推动大模型精准应用提供了强大助力。训练数据是影响大模型“认知能力”的关键,合合信息“大模型加速器 2.0”基于领先的智能文档处理技术,从数据源头入手,对复杂文档的版式、布局和元素进行精准解析及结构化处理,

  • 奔驰新款CLA接入豆包大模型

    4月22日,奔驰与火山引擎合作的首款国产纯电车型CLA全球首发亮相。该车搭载奔驰自研MB.OS架构,接入火山引擎大模型,支持个性化智能交互体验。智能系统可识别4种情绪并给予反馈,交互效率提升50%,唤醒仅需0.2秒。虚拟助手能解答百科问题并协助车辆功能设置。这是双方继2024年8月达成AI战略合作后落地的首款量产车型,结合生成式AI和大数据技术,为中国用户打造更智能的用车体验。

  • 迅雷一键即可完成大模型下载

    近日,迅雷为提升用户使用体验,让用户能够更快更好地批量下载大模型所有文件,已针对大模型下载场景进行了优化,并上线了新版本插件,下载迅雷客户端且在浏览器安装迅雷插件即可使用。值得一提的是,在使用迅雷该插件功能创建任务时,将同时创建相对应的文件夹,下载完成后,所有文件都将在一个文件夹中,相比传统浏览器——需要用户逐个手动点击下载图标并�

  • 删除用被复活!苹果回应iOS 18.4离奇Bug:可以考虑先不更新

    日前,苹果向iPhone用户推送iOS18.4正式版更新,带来多项新功能和优化修复。有不少用户反馈称更新iOS18.4后,iPhone上重新出现了此前早已删除的应用。新增10种系统语言支持。

  • 九为健康联合华为云发布神农中医大模型智能体,解码如何用大模型重构“望闻问切”

    2025 年 4 月 11 日,在华为云生态大会上,浙江九为健康科技股份有限公司(以下简称"九为健康")正式发布基于华为云盘古大模型的"九为神农中医大模型智能体"。该解决方案依托AI技术,系统性攻克中医药研发周期长、作用机制解析困难、个性化方案制定复杂等产业难题,通过智能化手段推动中医药现代化进程,为医药全产业链提供覆盖研发、诊疗及健康管理的全流程智能服�

  • 大模型时代的智能营销,从“玩具”到“工具箱”

    百度在Create大会上强调AI应用创造真正价值,发布智能营销一体化应用"客悦·ONE"。李彦宏指出,没有应用场景的芯片和模型毫无价值。百度智能云升级后整合文心、DeepSeek等大模型能力,实现从数据洞察到智慧触达的闭环营销体系。该产品在金融等行业已落地见效,自助解决率达93%以上,支持多模态交互和全渠道管理。百度通过全栈自研AI架构降低开发成本,推动行业智能化转型。

  • 大模型到AI基础设施,商汤的反向求解

    大模型落地如火如荼,从上一代AI浪潮中杀出来的商汤,嗅到了这里面新的机会。在最火的具身智能赛道,这两年诞生了许多明星创业公司。这些创业公司的创始人往往拥有技术明星的光环,不少都是在学术界中某个技术领域中响当当的领头人。这些初创公司虽然在某一个单点技术上遥遥领先(大脑、小脑或者本体),但在机器人落地过程中,要突破从单一技术到整体复杂产品