首页 > 业界 > 关键词  > GPT-4最新资讯  > 正文

GPT-4整顿学术圈!撤稿预测与人类95%一致

2024-04-16 11:36 · 稿源:站长之家

站长之家(ChinaZ.com)4月16日 消息:中国人民大学和浙江大学的研究团队进行了一项有趣的研究,他们发现GPT-4在预测学术论文撤稿方面的能力与人类审稿人有着惊人的相似性,准确度高达95%。这项研究不仅展示了大型语言模型在学术诚信维护中的潜在作用,同时也揭示了AI在学术研究问题上的应用关键在于如何为人类所用。

研究团队向GPT-4输入了数千篇SCI/SSCI期刊论文相关的一万多条推文,并让模型根据这些推文预测论文是否有可能被撤稿。这一过程与人类审稿人的预测结果进行了比较,结果显示GPT-4在预测撤稿方面的准确性接近人类专家。

image.png

论文地址:https://arxiv.org/ftp/arxiv/papers/2403/2403.16851.pdf

研究还探讨了推文本身是否能够预测论文撤稿的问题。通过分析一组包含3505篇撤稿论文的数据集,并与未撤稿的论文进行对比,研究者发现,确实有一部分推文能够在论文撤稿前暗示论文存在问题。这些推文通常直接指出论文中的错误或学术不端行为,或者使用批评和讽刺的方式来质疑论文的质量。

在比较不同模型预测论文撤稿的能力时,GPT-4的表现最为出色,其预测结果与人工预测结果的一致性最高。此外,GPT-4还能够为其预测提供理由,这是其他方法所不具备的。然而,研究也指出GPT-4有时会产生“幻觉”问题,可能会产生不恰当的输出,因此在使用时需要谨慎。

这项研究的结果不仅为学术界提供了一个新工具来预测和识别问题论文,同时也为社交媒体讨论作为论文撤稿早期预警系统的潜力提供了证据。研究者们的工作表明,生成式人工智能如ChatGPT在促进科研诚信方面有着巨大的应用潜力。

研究的作者之一,Er-Te Zheng(郑尔特),是中国人民大学信息资源管理学院的硕士生,他的研究方向涉及计算社会科学、科学学和科学计量。另一位作者,Hui-Zhen Fu(付慧真),是浙江大学公共管理学院信息资源管理系副教授,她的研究方向为交叉科学、科学计量、科研诚信和科研管理。而Zhichao Fang(方志超)是中国人民大学信息资源管理学院助理教授,他的研究方向为科学学、科学计量和社交媒体计量学。

举报

  • 相关推荐
  • Qwen登顶AI赚钱大赛只是开始?“弃GPT投Qwen”已在硅谷蔓延开来

    近期AI炒币大赛Alpha Arena引发关注,六款主流大模型用1万美元本金在币圈实战。戏剧性的是,被寄予厚望的GPT-5和Gemini因高杠杆操作亏损惨重,而中国开源模型表现亮眼——通义千问Qwen以53%回报率逆袭登顶,DeepSeek紧随其后。硅谷巨头Airbnb CEO公开表态依赖Qwen,投资人Chamath也承认将业务转向中国模型。市场用真金白银投票:预测平台押注Qwen胜率高达36%,远超OpenAI的3%。这场竞赛虽存随机性,但中国开源阵营已展现强劲势头。

  • 被AI引用才是真的流量:写出让GPT、Gemini主动引用的AI搜索友好型内容(实操清单 + 工具推荐)

    本文系统介绍生成式引擎优化(GEO)的核心方法,帮助内容从“给人看”升级为“AI友好型”。关键策略包括:1.采用结构化写作框架,在开头设置可直接回答问题的“黄金段落”;2.运用分步清单、数据标注、FAQ等模块提升内容引用率;3.通过多平台同步分发增加曝光;4.使用AIBase等工具量化监测内容被AI引用的频率与场景,并给出5天落地执行表。

  • 铭凡MS-S1 MAX正式发布:126TOPS总算力的AI工作站,提供 USB4 v2、PCle 4插槽

    印凡MS-S1MAX迷你AI工作站体积仅3.3升,集成126TOPS算力,搭载AMD锐龙AI Max处理器与Radeon 8060核显,支持本地运行1280亿参数大模型。配备128GB LPDDR5X内存、双M.2插槽及高速USB4接口,采用先进散热设计实现130W稳定输出。紧凑机身支持灵活部署,为企业本地AI与边缘计算提供高效解决方案。

  • OpenAI推出AI浏览器ChatGPT Atlas 开启个性化上网新体验

    OpenAI于10月22日推出首款AI驱动浏览器ChatGPT Atlas,以个性化上网体验为核心。用户点击“Ask ChatGPT”即可在侧边栏实时互动,实现网页摘要生成、航班预订、文档编辑等多样化任务。目前仅支持macOS,未来将扩展至Windows和移动端。高级代理功能暂限付费用户使用,其特色包括自动捕捉页面上下文、分屏浏览及记忆用户操作历史,旨在通过自然对话提升网络使用效率。

  • 如何提升品牌在AI回答中的提及率?GEO优化3招,让ChatGPT主动提及你的品牌

    本文探讨AI搜索时代品牌面临的"隐身危机",指出AI搜索用户年增538.7%,但品牌在AI回答中提及率不足20%。提出三大核心策略:1)构建权威背书矩阵,通过知乎等高权重平台获取自然提及;2)优化AI友好内容,采用对话式标题和结构化数据;3)建立数据监测闭环,通过A/B测试持续迭代。强调需善用监测工具实时追踪品牌在豆包、文心一言等AI模型的曝光表现,避免内容"注水"。最终实现从"被动等待"到主动抢占AI"第一屏"的转变。

  • AI日报:腾讯发布全新ima2.0;微软发布 Copilot 一系列重磅更新;阿里夸克AI眼镜开启预售

    本文汇总近期AI领域重要动态:月之暗面再获数亿美元融资,显示资本对国产大模型的信心;Anthropic为Claude推出记忆功能,兼顾个性化与隐私保护;中科大与字节发布MoGA长视频生成模型,实现分钟级高质量生成;腾讯ima2.0升级任务模式,可自主拆解复杂流程;阿里夸克AI眼镜开启预售,融合拍摄与智能功能;微软Copilot新增群聊、记忆与Edge AI模式;Opera推出深度研究代理ODRA提升�

  • Sora App的AI视频社交,给了百度们新希望

    Sora2发布两周后,百度的蒸汽机AI视频模型,和谷歌Veo3.1撞了档期。 两家公司选择同期发布并非有多默契,而是Sora2带来的压迫感促使它们不得不加快脚步。 奥尔特曼将形容Sora2为“创意领域的ChatGPT3.5时刻”,不仅在物理逻辑、画面连贯性、真实感和音画同步等方面实现了质的飞跃,还把Sora从一个“文本到视频”的工具进化成一个“创意到生态”的平台。 这无疑是扔在AI视�

  • 重磅预告:全链路自主进化 AI 数据分析师 TabTab 将于10月24日上线

    灵快科技推出的AI数据分析师TabTab将于10月24日上线。该产品通过Multi-Agent系统实现全链路自动化数据分析,覆盖数据获取、建模到可视化全流程。用户可用自然语言交互,系统自主规划任务并输出可维护结果,支持Excel、PPT等多种报告格式。核心定位为智能数据分析助手,旨在降低分析门槛,助力企业高效挖掘数据价值,适用于数据分析师、营销人员等各类用户。

  • ROBOT PHONE登场:荣耀为AI终端开了自进化的未来新局

    ​十年前,AI还停留在算力、模型与数据此消彼长的层面。如今,技术的发展早已超乎想象。 2025年上半年,Google DeepMind重磅推出的AlphaEvolve揭示了一个重要趋势:AI开始拥有“自我成长”的能力。 AlphaEvolve是一种典型的“自进化系统”,它结合了Gemini模型的创造性问题解决能力,以及自动化评估器(Evaluator)的反馈学习机制,能够判断“什么是好的”,并据此不断自我优化。 �

  • GEO如何改变ChatGPT搜索和Perplexity的游戏规则

    本文对比ChatGPT与Perplexity两大AI搜索平台:ChatGPT作为全能型助手,整合搜索与多任务处理,但存在信息时效性不足;Perplexity专注垂直搜索,强调引用透明与权威来源。针对AI搜索优化(GEO),提出差异化策略:面向ChatGPT需构建结构化知识库、强化品牌实体识别;面向Perplexity需注重权威数据引用和元数据优化。文章还介绍了AIBase的GEO监测工具,通过曝光率等指标量化内容在AI生态中的可见度,并给出可落地的优化行动方案。

今日大家都在搜的词: