首页 > 业界 > 关键词  > 斯坦福最新资讯  > 正文

斯坦福回应抄袭清华系大模型 公开道歉并删除推文

2024-06-04 16:40 · 稿源:站长之家

斯坦福大学的一个AI团队在 5 月 29 日发布了一个名为Llama3-V的多模态大模型,并宣称只需 500 美元就能训练出一个性能与GPT4-V相媲美的模型。然而,该模型随后被指控抄袭,与国内由面壁智能和清华大学自然语言处理实验室联合推出的大模型MiniCPM-Llama3-V 2. 5 存在极高的相似度。

面壁智能的CEO李大海和联合创始人刘知远对此事件先后发表回应,认为尽管这在某种程度上可以看作是他们成果得到了国际团队的认可,但他们更希望建立一个开放、合作、有信任的社区环境。目前,斯坦福的团队已经公开道歉,并删除了相关库和官宣推文。

Llama3-V模型在社交媒体上迅速走红,并一度登上了HuggingFace趋势榜首页。但随后,一名网友发现Llama3-V与MiniCPM-Llama3-V 2. 5 在结构、代码、配置文件上几乎一模一样,仅有变量名被替换。网友在面壁智能GitHub的项目下展示了一系列证据。

刘知远教授在知乎上回应称,MiniCPM-Llama3-V 2. 5 在研发时内置了一个彩蛋,即对“清华简”的识别能力,而Llama3-V模型也展现出了一模一样的能力。清华简是清华大学收藏的一批战国竹简,为战国中晚期文物。刘知远透露,识别清华简是MiniCPM-Llama3-V 2. 5 的一项实验功能,训练图像是最近从出土文物中扫描并标注的,且尚未公开发布。

遭到质疑后,斯坦福团队成员删除了官宣模型的推文,并将项目在Github和HuggingFace上的库一并删除。团队成员森德哈斯·沙玛(Siddharth Sharma)和阿克沙·加格(Aksh Garg)在社交平台上向面壁MiniCPM团队正式道歉,并表示会将Llama3-V模型撤下。

李大海在声明中表达了对此事的深切遗憾,并强调应该构建一个开放、协作且充满信任的技术社区环境。他们希望团队的努力和优秀工作能够吸引更多人的关注和认可,但并非以被模仿或抄袭的方式。

斯坦福人工智能实验室主任克里斯托弗·大卫·曼宁(Christopher David Manning)也发文谴责这一抄袭行为。

面壁智能首席科学家刘知远表示,人工智能的飞速发展离不开全球算法、数据与模型的开源共享,让人们始终可以站在SOTA的肩上持续前进。开源共享的基石是对开源协议的遵守,对其他贡献者的信任,对前人成果的尊重和致敬,Llama3-V团队无疑严重破坏了这一点。

面壁智能成立于 2022 年 8 月,由李大海担任CEO,曾国洋为法定代表人,注册资本约52. 46 万人民币。公司已完成两轮融资,由知乎、智谱AI等投资。李大海毕业于北京大学数学系,曾任Google中国创始员工之一,后在知乎担任合伙人、CTO。刘知远是清华大学计算机系长聘副教授,智源青年科学家,主要研究方向为自然语言处理、知识图谱和社会计算。

举报

  • 相关推荐
  • 国内有哪些ai大模型?一文看懂中国核心AI大模型全景

    近两年中国AI大模型发展迅猛,已形成"通用+行业"双轨并进的生态格局。百度文心一言、阿里通义千问等通用大模型在中文理解、多模态生成等方面表现突出;深度求索DeepSeek以1/10参数实现GPT-4级推理能力;月之暗面Kimi以20万汉字上下文窗口领跑长文本处理;智谱AI的GLM-4成为首个支持视频对话的国产千亿模型。医疗、金融等垂直领域涌现出百川智能等专业模型,覆盖超1000家医院。开源生态加速国产芯片适配,15家厂商完成深度优化。行业应用方面,工程文档效率提升60%,24小时拟人化客服等案例凸显价值。未来趋势呈现模型蒸馏、端侧部署和开源生态三大方向,中国AI正从实验室走向产业变革前沿。

  • 主流AI多模态大模型有哪些?超全的多模态大模型指南分享

    2024年多模态大模型成为AI领域最具前景的技术方向之一。文章全面分析了主流多模态大模型的特点、应用场景和发展趋势。多模态大模型能同时处理文本、图像、音频、视频等多种数据,实现更智能的人机交互。重点介绍了GPT-4V、Claude3.5、Gemini、通义千问等代表性模型,对比了它们在视觉理解、编程能力、中文处理等方面的优势。应用场景涵盖智能客服、内容创作、教育医疗等领域。未来发展趋势包括模型规模扩大、支持更多模态、实时交互能力提升等。选择模型需考虑应用需求、语言支持、性能成本等因素。

  • “晓妙”产业大模型——AI驱动的产业变革

    7月4日,安徽数智建材研究院在长城工程科技会议上发布"晓秒"产业大模型。该模型由傲林科技投资支持,采用"1+1+N"架构,融合数据、机理和业务模型,实现生产运营全流程实时闭环优化。中国建材集团董事长周育先表示,该模型已在水泥板块试点应用,吨水泥成本降低1%以上,能耗电耗下降2%以上。会议指出,AI落地制造业需突破三大关键:建立数字化体系、夯实数据基础、实现工艺与数据融合。未来将拓展至新能源、钢铁等十余个行业,推动产业智能化升级。

  • 周杰伦快手账号修改签名:删除“全网唯一”

    7月9日,华语流行乐歌手周杰伦正式开通抖音账号,取名周同学”,并选择用玩偶形象作为账号头像。 在账号开通后的24小时内,周杰伦未发布任何视频作品,但粉丝量就突破1000万。 7月11日,周同学”发布第一条抖音视频,用抖音目前流行的AI技术,展示了自己从小到大的照片。 截至发稿周杰伦抖音账号粉丝已超1950万。

  • 北大退学考上清华小伙回应开直播:没想过 只想跟大家聊天

    6 月 30 日,一则关于河南小伙郭恩惠的消息引发众多关注。据媒体报道,郭恩惠有着一段独特的求学经历, 2019 年,他成功考入北京大学医学院护理专业,然而入学后,他选择退学并复读。经过一年的努力, 2020 年,郭恩惠再次在高考中取得优异成绩,顺利考入清华大学。 上周,郭恩惠在抖音平台开启了个人首场直播。直播过程中,他与网友们积极交流,针对志愿填报、

  • 文生图大模型有哪些?探索AI绘画的核心引擎与选择利器

    本文探讨了当前主流的AI文生图技术及其应用场景。国际阵营中,OpenAI的DALL·E3擅长复杂语义理解,MidJourney以艺术风格见长,Stable Diffusion则以开源生态支持深度定制。中国力量方面,百度文心一格在中文语义和国风创作表现突出,阿里通义万相侧重商业化应用,昆仑万维天工支持长文本生成连贯图像。垂直领域工具如Adobe Firefly深度集成设计流程,Runway ML革新视频创作。文章建议通过聚合平台高效对比模型特性,并指出下一代技术将突破分辨率限制,实现跨模态生成。从精准语义到无限可能,AI文生图正在重塑视觉创作边界。

  • 1岁男孩被女子强搂亲吻后发烧得水痘 妈妈愤怒回应:太可恶

    ​7月13日,湖南发生一起引发社会关注的事件:一名女子强行搂抱并亲吻一名仅1岁多的男童,导致孩子当晚突发高烧,随后被确诊为水痘,手腿部位布满红包。据男孩母亲透露,事发后她立即要求涉事女子道歉,但未获得任何正面回应。 男孩母亲在社交平台发帖详细讲述了事情经过。她表示,涉事女子自己的孩子刚患水痘不到一周,且其孩子发烧后刚从医院返回,该女子在明�

  • 玄武云出席崔牛会AI活动,聊聊AI大模型如何掌握终端信息

    6月20日,崔牛会主办的AI发现者计划之AI+OPEN DAY在广州举办,玄武云与百度云等企业围绕AI大模型应用展开探讨。玄武云分享了快消行业数字化转型解决方案,推出SKU超级模型和价签识别模型,帮助品牌商提升终端管理效率。其中SKU模型覆盖6000+商品,识别准确率达90%;价签模型准确率85%,已应用于知名薯片品牌。通过AI技术实现商品陈列优化、价格监控和渠道布局分析,助力快消企业从经验驱动转向数据智能驱动,在存量市场中创造增量价值。

  • 男子在汽车引擎盖贴车衣养鱼 交警回应:非法改装 不能上路

    近日,辽宁沈阳一男子,在车辆引擎盖车衣内养鱼的视频,引起网友关注热议。 视频中,这辆新能源车的引擎盖上的车衣内注满了水,且水中还有几条大鱼在游动,看上去相当魔幻。 随后,男子更是把这当成了车衣鱼缸”,往里面放了各种各样的鱼类,甚至还有螃蟹。 此事引起热议后,沈阳市公安局沈北新区交警大队工作人员向媒体表示,该车主的行为属于非法改装,不�

  • 男子拍下奇异“麦田漩涡” 回应:然而当时并没有刮风

    近日,一段安徽宿州麦田出现神秘"漩涡"的视频在网络引发热议,画面中金黄的麦浪呈螺旋状翻滚,而周边麦田却纹丝不动,被网友戏称为现实版"麦旋风"。 7 月 6 日,拍摄者王先生证实,该现象发生于宿州某风力发电场附近,拍摄时风力发电机叶片正常运转,但麦田周边并无明显自然风。