首页 > 业界 > 关键词  > GPT-4最新资讯  > 正文

GPT-4整顿学术圈!撤稿预测与人类95%一致

2024-04-16 11:36 · 稿源:站长之家

站长之家(ChinaZ.com)4月16日 消息:中国人民大学和浙江大学的研究团队进行了一项有趣的研究,他们发现GPT-4在预测学术论文撤稿方面的能力与人类审稿人有着惊人的相似性,准确度高达95%。这项研究不仅展示了大型语言模型在学术诚信维护中的潜在作用,同时也揭示了AI在学术研究问题上的应用关键在于如何为人类所用。

研究团队向GPT-4输入了数千篇SCI/SSCI期刊论文相关的一万多条推文,并让模型根据这些推文预测论文是否有可能被撤稿。这一过程与人类审稿人的预测结果进行了比较,结果显示GPT-4在预测撤稿方面的准确性接近人类专家。

image.png

论文地址:https://arxiv.org/ftp/arxiv/papers/2403/2403.16851.pdf

研究还探讨了推文本身是否能够预测论文撤稿的问题。通过分析一组包含3505篇撤稿论文的数据集,并与未撤稿的论文进行对比,研究者发现,确实有一部分推文能够在论文撤稿前暗示论文存在问题。这些推文通常直接指出论文中的错误或学术不端行为,或者使用批评和讽刺的方式来质疑论文的质量。

在比较不同模型预测论文撤稿的能力时,GPT-4的表现最为出色,其预测结果与人工预测结果的一致性最高。此外,GPT-4还能够为其预测提供理由,这是其他方法所不具备的。然而,研究也指出GPT-4有时会产生“幻觉”问题,可能会产生不恰当的输出,因此在使用时需要谨慎。

这项研究的结果不仅为学术界提供了一个新工具来预测和识别问题论文,同时也为社交媒体讨论作为论文撤稿早期预警系统的潜力提供了证据。研究者们的工作表明,生成式人工智能如ChatGPT在促进科研诚信方面有着巨大的应用潜力。

研究的作者之一,Er-Te Zheng(郑尔特),是中国人民大学信息资源管理学院的硕士生,他的研究方向涉及计算社会科学、科学学和科学计量。另一位作者,Hui-Zhen Fu(付慧真),是浙江大学公共管理学院信息资源管理系副教授,她的研究方向为交叉科学、科学计量、科研诚信和科研管理。而Zhichao Fang(方志超)是中国人民大学信息资源管理学院助理教授,他的研究方向为科学学、科学计量和社交媒体计量学。

举报

  • 相关推荐
  • 奥特曼惊呼奇点临近!95%人类饭碗将被AI抢走,2028年百万AI上岗

    奇点将至?奥特曼再次释放「六字」神秘信号!谷歌文档之父、机器学习博士纷纷预测,AGI降临那天,95%人类工作或被AI取代。奇点又进了一步?!昨天,OpenAI智能体安全研究员StephenMcAleer突然发出一番感慨:紧随其后,奥特曼发表了意味深长的「六字箴言」:nearthesingularity;unclearwhichside——奇点临近;不知身处何方。从道德上讲,公司应该与公众分享计划中的细节,尤其是影响力更大的A

  • 马斯克预测:2027年左右AI智力或将反超人类

    科技企业家埃隆·马斯克在社交媒体上分享了他对人工智能未来发展的预测,其观点引发了广泛关注。马斯克认为,AI的发展速度超出了人类的认知速度,他预言到2025年底,AI的智力水平将超过任何单一的人类个体。马斯克的预测和Hassabis的警告,共同勾勒出了AI发展的双重图景,既有巨大的潜力也有不可忽视的风险。

  • 重磅!微软开源最强小模型Phi-4,超GPT-4o、可商用

    微软研究院开源了目前最强小参数模型——phi-4。去年12月12日,微软首次展示了phi-4,参数只有140亿性能却极强,在GPQA研究生水平、MATH数学基准测试中,超过了OpenAI的GPT-4o,也超过了同类顶级开源模型Qwen2.5-14B和Llama-3.3-70B。在与其他类似规模和更大规模的模型比较中,phi-4在12个基准测试中的9个上优于同类开源模型Qwen-2.5-14B-Instruct。

  • OpenAI开启调查:GPT-4o及4o-mini模型性能下降

    据报道,OpenAI发布事故报告指出,当前遭遇GPT-4o和4o-mini模型性能下降问题,目前正在进行调查,并将尽快发布最新消息。科研人员创新性地推出了一项名为LONGPROC的基准测试工具,该工具专为评估模型在处理长上下文中的复杂信息并生成相应回复的能力设计。特别是在需要输出8ktokens的任务中,即便是参数庞大的先进模型也未能幸免于难,这或许预示着未来大型语言模型研究的

  • Pick合生元贝塔星耀奶粉,轻松养成人类“肉”崽

    很多家长应该都发现了,宝宝到了断奶期肠胃表现总是很脆弱,不是不爱吃奶就是肚肚不舒服。断奶期稍微有个风吹草动,好不容易养胖一点点的小脸就又瘦回去了。为宝宝选择合生元贝塔星耀奶粉,就是选择了宝宝健康成长的坚实后盾,轻松养成健康可爱的“肉”崽。

  • 返老还童,OpenAI做到了?首个逆龄AI将登场,人类寿命可延长10年

    【新智元导读】逆龄AI真的被OpenAI实现了!新模型GPT-4bmicro通过蛋白质重编程技术,有望将人类寿命延长十年。超级智能要来了?人类「长生不老」有希望了?外媒称,OpenAI开发出了首款用于「长寿」的AI模型——GPT-4bmicro,预计将人类寿命延长10年。至关重要的是,要平衡这些进步的巨大潜力与积极措施来降低风险,为未来做好准备。

  • 阿丘科技农产品西红柿分选:分选精度达到95%以上

    农产品行业作为国民经济的基础,当前市场规模庞大且持续增长,该行业产业链结构复杂而完善,涵盖了从农业生产资料供应(如种子、化肥、农药等)、农作物种植与养殖、农产品加工、流通到最终消费的全过程。随着农业现代化进程的加快和消费者对食品安全、品质要求的提高,农产品行业正朝着规模化、标准化、品牌化方向发展。未来,农产品行业将更加注重科技创新和可

  • 联发科最强芯!天玑9500首曝:2+6设计 CPU将突破4GHz

    博主数码闲聊站曝光了联发科下一代旗舰平台天玑9500的参数细节,这是联发科最强悍的手机芯片。天玑9500采用全新的26架构设计,包含2颗X930超大核心和6颗A730大核心,频率预计会突破4GHz,支持SME指令集,基于台积电最新的第三代3nm制程打造,性能大升级。按照以往的惯例,vivoX系列新品通常会是天玑新旗舰平台的首发机型,因此vivoX300系列有望首发天玑9500处理器。

  • AI日报:可灵AI API对口型能力全面开放;豆包大模型宣称追平GPT-4;百度2024年度AI提示词“答案”;通义千问视觉模型直降80%

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、可灵AIAPI对口型能力全面开放、虚拟试穿升级至V1.5模型北京快手科技有限公司近日宣布可灵AIAPI完成新一轮升级,主要在虚拟试穿和对口型功能上取得显著进展。Run:ai的软件能够�

  • 胡家奇:第十一次致人类领袖的公开信

    致:各国领导人、联合国秘书长、世界顶级科学家与学者、知名企业家、知名媒体人。 尊敬的各位领袖:回望刚刚过去的 2024 年,我深感,我们又一次站在了历史的十字路口。科技进步带来了巨大的希望,也带来了同样深刻的危机。作为“拯救人类行动组织(人类会)”的创始人,我怀着极大的焦虑与责任,再次写信给您们。今天,我们面临的不仅仅是科技发展的挑战,更是�