首页 > 业界 > 关键词  > GPT-4最新资讯  > 正文

GPT-4整顿学术圈!撤稿预测与人类95%一致

2024-04-16 11:36 · 稿源:站长之家

站长之家(ChinaZ.com)4月16日 消息:中国人民大学和浙江大学的研究团队进行了一项有趣的研究,他们发现GPT-4在预测学术论文撤稿方面的能力与人类审稿人有着惊人的相似性,准确度高达95%。这项研究不仅展示了大型语言模型在学术诚信维护中的潜在作用,同时也揭示了AI在学术研究问题上的应用关键在于如何为人类所用。

研究团队向GPT-4输入了数千篇SCI/SSCI期刊论文相关的一万多条推文,并让模型根据这些推文预测论文是否有可能被撤稿。这一过程与人类审稿人的预测结果进行了比较,结果显示GPT-4在预测撤稿方面的准确性接近人类专家。

image.png

论文地址:https://arxiv.org/ftp/arxiv/papers/2403/2403.16851.pdf

研究还探讨了推文本身是否能够预测论文撤稿的问题。通过分析一组包含3505篇撤稿论文的数据集,并与未撤稿的论文进行对比,研究者发现,确实有一部分推文能够在论文撤稿前暗示论文存在问题。这些推文通常直接指出论文中的错误或学术不端行为,或者使用批评和讽刺的方式来质疑论文的质量。

在比较不同模型预测论文撤稿的能力时,GPT-4的表现最为出色,其预测结果与人工预测结果的一致性最高。此外,GPT-4还能够为其预测提供理由,这是其他方法所不具备的。然而,研究也指出GPT-4有时会产生“幻觉”问题,可能会产生不恰当的输出,因此在使用时需要谨慎。

这项研究的结果不仅为学术界提供了一个新工具来预测和识别问题论文,同时也为社交媒体讨论作为论文撤稿早期预警系统的潜力提供了证据。研究者们的工作表明,生成式人工智能如ChatGPT在促进科研诚信方面有着巨大的应用潜力。

研究的作者之一,Er-Te Zheng(郑尔特),是中国人民大学信息资源管理学院的硕士生,他的研究方向涉及计算社会科学、科学学和科学计量。另一位作者,Hui-Zhen Fu(付慧真),是浙江大学公共管理学院信息资源管理系副教授,她的研究方向为交叉科学、科学计量、科研诚信和科研管理。而Zhichao Fang(方志超)是中国人民大学信息资源管理学院助理教授,他的研究方向为科学学、科学计量和社交媒体计量学。

举报

  • 相关推荐
  • 美团发布高效推理模型LongCat-Flash-Thinking:部分性能接近GPT5

    9月23日,美团LongCat团队发布全新高效推理模型LongCat-Flash-Thinking。该模型在保持极致速度的同时,性能更强大、更专业,在逻辑、数学、代码、智能体等多个领域的推理任务中达到全球开源模型最先进水平(SOTA),部分任务性能接近闭源模型GPT5-Thinking。它增强了智能体自主调用工具能力,扩展了形式化定理证明能力,成为国内首个结合深度思考、工具调用与非形式化、形式化推理的大语言模型。在数学、代码、智能体等高复杂度任务上表现尤为突出,多项基准测试成绩领先开源及闭源顶尖模型,已在HuggingFace、Github全面开源。

  • OpenAI发布GPT-5-Codex:可完成7小时单次编程任务

    OpenAI宣布推出新一代AI编程模型GPT-5-Codex,其最大亮点是创新的动态时间分配系统。 不同于传统AI追求秒级响应”,该模型可根据任务复杂度灵活调整处理时长,从数秒到7小时不等,以更接近人类专家的决策方式优化代码质量。 GPT-5-Codex产品负责人亚历山大恩比里科斯解释称,传统模型在任务初期即固定计算资源,而GPT-5-Codex能实时评估需求:动态决定加速推进、暂停语法核�

  • 性能超越GPT-4o及Qwen2.5-VL,百度超轻量小模型PP-OCRv5 Blog持续登顶Hugging Face热度第一

    百度发布超轻量级文字识别模型PP-OCRv5,仅0.07B参数却实现媲美700亿参数大模型的OCR精度。在多项测试中超越GPT-4o等通用视觉大模型,尤其在文本定位和边界框精度上表现优异。该模型支持5种文字类型识别,适用于教育、医疗、法律等多行业数字化需求,累计下载量超900万,是GitHub上唯一Star数超5万的中国OCR项目。

  • HTTP 402与微支付:一段沉睡三十年的代码,在AI时代觉醒

    30年前HTTP 402协议因交易成本高、体验割裂和技术缺失而失败,如今AI时代带来消费原子化、决策流线化和主体去人化三大变革,使微支付成为可能。AI代理通过钱包身份、风控机制和无缝支付协议实现高频小额交易,重构互联网经济逻辑,让HTTP 402从理想变为AI经济的支付基石。

  • 百度文心大模型X1.1正式发布:超越DeepSeek R1、打平GPT-5

    今天,在WAVE SUMMIT深度学习开发者大会2025上,百度文心大模型X1.1正式发布,在事实性、指令遵循、智能体等能力上均提升显著。 百度王海峰介绍,文心大模型X1是基于文心大模型4.5训练而来的深度思考模型,升级后的X1.1主要采用了迭代式混合强化学习训练框架。 一方面通过混合强化学习,同时提升通用任务和智能体任务的效果;另一方面通过自蒸馏数据的迭代式生产及训练

  • “骨声纹+同传”,时空壶 W4 AI 同传耳机创新黑科技

    深圳时空壶技术有限公司在跨语言交流领域持续创新,其最新产品W4AI同传耳机凭借“骨声纹”拾音技术实现突破。该技术通过内置传感器捕捉耳骨振动信号,有效避免环境噪音干扰,在高达100dB的嘈杂环境中语音识别准确率仍超98%。W4支持42种语言即时互译,适配商务洽谈、国际会议等多场景,提供精准翻译及自定义热词功能。相比传统麦克风拾音设备,W4从根本上解决了复杂环境下的翻译质量难题,为全球用户带来高效、便捷的跨语言沟通体验,有望引领行业技术革新。

  • AI眼镜的痛,Meta也治不了

    对于全球科技从业者而言,Meta Connect大会是一年一度的重要时刻。 不少人早早守在电脑前,想知道扎克伯格此次会带来哪些前沿技术产品,更对会上即将亮相的新款AI眼镜充满关注。 事实上,AI眼镜这类消费电子产品,在过去一年里已快速从“小众科技产品”走进大众视野,但看似火热的市场背后,AI眼镜当下的发展却陷入了明显瓶颈。 此前,国内AI眼镜市场曾掀起“百镜大

  • AI日报:快手推出AI视频制作助手Kwali;字节跳动推出USO模型;OpenAI推出ChatGPT开发者模式

    本文介绍了AI日报栏目,聚焦AI领域最新动态。快手推出Kwali视频助手,简化视频制作流程;字节跳动发布USO模型,解决图像生成中风格与主题的矛盾;微软推出Copilot Audio音频模式,提供个性化语音交互;Stability AI升级Stable Audio 2.5,支持高质量音频生成;阿联酋推出开源大模型K2 Think,拥有320亿参数;微信上线智能回复功能,提升公众号运营效率;OpenAI推出ChatGPT开发者模式,支持AI控制外部工具;字节跳动Seed团队发布AgentGym-RL框架,提升语言模型决策能力;月之暗面开源Checkpoint Engine中间件,优化LLM推理效率;B站开源IndexTTS-2.0文本转语音系统,支持情感与时长控制;Replit推出Agent 3编程助手,自主性提升10倍。

  • OPPO Find X9系列外观公布:共有4款配色

    9月23日,OPPO正式揭晓Find X9系列外观设计,采用独特小矩阵相机DECO,推出绒砂钛、绒光钛、霜白、雾黑四款配色。该系列工艺精湛,绒砂钛版实现镜组与机身一体感,正面配备极窄四等边直屏与金属直角边框。核心配置搭载联发科天玑9500平台,采用第三代3纳米工艺,集成全新CPU、GPU G1-Ultra及Imagiq 1190影像处理器,性能、功耗、影像和AI能力显著提升,GeekBench单核跑分达4007,多核11217。此外,首发搭载全场景真1nit明眸护眼屏,从材料到算法均由OPPO深度定制,实现端到端显示素质把控,提升视觉舒适度。

  • AI员工正在赋能千行百业,企业在选择AI员工时,应该重点对比这4项重要能力!

    国务院发布《关于深入实施“人工智能+”行动的意见》,明确AI与实体经济、社会各领域深度融合成为国家战略。文章指出企业应重点考察AI员工的业务适配性、执行能力、系统对接能力和持续进化能力,选择能深度理解行业逻辑、完成真实任务、无缝对接现有系统并持续学习的AI工具,以提升效率、解放人力,把握智能化转型机遇。

今日大家都在搜的词: