首页 > 业界 > 关键词  > ChatGPT最新资讯  > 正文

OpenAI 的 ChatGPT 在文本标注任务方面优于人类工作者

2023-03-29 11:20 · 稿源:站长之家

站长之家(ChinaZ.com) 3月29日消息:苏黎世大学的研究人员在论文预印本平台 arXiv 上发表论文,报告 OpenAI 的 AI 聊天机器人 ChatGPT 在文本标注任务中的表现超过了众包工人。

gpt-4,OpenAI,ChatGPT Plus,人工智能

大量的自然语言处理(NLP) 应用程序需要为各种任务手动标注数据,特别是训练分类器或评估无监督模型的性能。根据规模和复杂程度,任务可能由众包工作者在 MTurk 等平台上以及训练有素的标注人员(如研究助理)上执行。

研究人员使用包含 2382 条推文的样本,对比证明了 ChatGPT 在多项标注任务(包括相关性、立场、主题和框架检测)方面优于众包工作者。

具体来说,在五分之四的任务中,ChatGPT 的评估一致性(intercoder agreement)超过了众包工作者,而 ChatGPT 的编码器间协议在所有任务上都超过了众包工作者和训练有素的标注人员。

此外,ChatGPT 的每条标注成本不到 0.003 美元——大约比 MTurk 便宜 20 倍。研究显示大语言模型可显著提高文本分类的效率。

举报

  • 相关推荐
  • 女子用ChatGPT选号中百万大奖 全部捐出帮助有需要的人

    美国弗吉尼亚州女子卡丽爱德华为非经常购彩者,近日通过手机向ChatGPT询问彩票号码建议,AI提供几组数字供参考。她购买后幸运中得15万美元(约106万元人民币)大奖。领奖时她当场宣布将全部奖金捐出,帮助有需要的人,并表示自己已足够幸运,希望以此鼓励其他中奖者回馈社会。

  • 聚焦“视觉+机器人”!思看科技与艾利特机器人达成战略合作

    9月22日,思看科技与埃利特机器人在苏州签署战略合作协议。双方将聚焦“视觉+机器人”领域,在资源共享、市场拓展、生态共建等方面深化合作,共同推动机器人视觉感知与决策控制、人机交互等关键技术的创新突破。思看科技在三维视觉数字化领域技术领先,埃利特机器人拥有协作机器人全栈自研能力,双方优势互补,致力于在高端制造场景中实现“手眼合一”,赋能行业智能化转型。此次合作标志着两家企业在机器人与视觉融合领域迈出关键一步,未来将共同推动三维视觉与机器人技术的深度协同创新。

  • OPPO Watch S官宣:轻薄表皇

    OPPO宣布将于10月16日推出OPPO Watch S智能手表,主打“轻薄表皇”设计,厚度不足9mm,号称目前市面上最薄的智能圆表。搭载全新智能手表系统,操作体验媲美手机,健康配置亦有惊喜。同时具备“健身教练”功能,可自动识别运动并提供超100种运动模式,专业记录数据。此外,发布会还将推出OPPO Find X9和X9 Pro旗舰手机,首批搭载联发科天玑9500平台,出厂预装全新ColorOS 16系统。

  • 华为云CloudRobo构筑云上机器人工厂,助力机器人开发应用成本全面降低

    华为在2025全联接大会上发布CloudRobo具身智能平台,通过云端赋能打破机器人硬件限制,实现轻量化、智能化和场景泛化。该平台整合数据生产、训练及运行管理,支持多领域落地应用,并联合行业伙伴共建R2C协议,推动具身智能产业规模化发展。

  • AI日报:快手推出AI视频制作助手Kwali;字节跳动推出USO模型;OpenAI推出ChatGPT开发者模式

    本文介绍了AI日报栏目,聚焦AI领域最新动态。快手推出Kwali视频助手,简化视频制作流程;字节跳动发布USO模型,解决图像生成中风格与主题的矛盾;微软推出Copilot Audio音频模式,提供个性化语音交互;Stability AI升级Stable Audio 2.5,支持高质量音频生成;阿联酋推出开源大模型K2 Think,拥有320亿参数;微信上线智能回复功能,提升公众号运营效率;OpenAI推出ChatGPT开发者模式,支持AI控制外部工具;字节跳动Seed团队发布AgentGym-RL框架,提升语言模型决策能力;月之暗面开源Checkpoint Engine中间件,优化LLM推理效率;B站开源IndexTTS-2.0文本转语音系统,支持情感与时长控制;Replit推出Agent 3编程助手,自主性提升10倍。

  • 哥伦比亚海关正式采用IQAX eBL处理进口货物 通过GSBN Doc Viewer应用程序进行实时核验

    2025年9月17日,IQAX公司宣布哥伦比亚海关正式认可其电子提单(eBL)。该系统通过区块链技术简化验证流程,海关只需扫描二维码即可实时核验单据真实性。此举显著提升清关效率与安全性,降低欺诈风险,推动无纸化贸易。中远海运已通过GSBN平台实现电子提单实时核验,未来将进一步拓展拉美市场应用。

  • iOS 26.1首个Beta版更新发布 苹果AI支持更多语言

    苹果发布iOS 26.1开发者预览版Beta更新,内部版本号23B5044l。主要更新包括:Apple Intelligence新增丹麦语、荷兰语、挪威语、葡萄牙语、瑞典语、土耳其语、繁体中文及越南语支持;AirPods实时翻译功能扩展至日语、韩语、意大利语和中文(含繁简);电话应用数字键盘采用全新液态玻璃设计。此外,Apple Music支持滑动切换歌曲,照片、日历和Safari浏览器迎来视觉优化。iOS 26正式版已于9月16日推送,适配第二代iPhone SE及之后共25款机型,iPhone 17系列和iPhone Air出厂预装该系统。

  • 上海一男子自家院子喝茶看俩机器人洗车:虽然洗不干净 但体验感拉满

    近日,上海一名男子在自家院子喝茶时,拍摄两台机器人洗车的视频引发热议。机器人有条不紊地完成打泡沫、持枪冲洗等动作,男子悠闲旁观,称体验“拉满了”。他因被机器人运动会视频“种草”,一口气购入两台,经反复调试才实现功能。男子表示,机器人带来的乐趣远胜洗车效果本身,唯一遗憾是洗得不够干净。网友热议称,这解决了“家里没有残障人士的问题”,并精准指出买机器人不为洗干净,而是图好玩和情绪价值。

  • 华为WATCH GT 6/Pro系列手表发布 售价1488元起

    华为于9月24日正式发布WATCH GT6系列智能手表,起售价1488元。该系列提供41mm和46mm两种尺寸,搭载OLED屏幕,续航最长可达21天,支持5ATM防水和IP69防尘。GT6 Pro新增跌倒检测、ECG心电图分析及专业运动模式,并配备蓝宝石玻璃表镜。全系采用高硅叠片电池技术,能量密度提升37%,支持无线快充。此外,首次应用骑行模拟功率功能,并搭载TruSense技术,精准监测心率、血氧等健康指标。GT6 Pro起售价2488元,进一步满足专业用户需求。

  • 赫力昂联合Springer Nature旗下自然定制揭秘大脑抗衰

    全球老龄化加速,大脑健康成为焦点。9月16日是中国脑健康日,9月21日是世界阿尔茨海默病日。数据显示,2020至2023年全球60岁以上人口增长40%,达14亿;中国60岁以上人口超3亿,占比22%。阿尔茨海默病带来的经济负担约占GDP的1.47%。科学界正探索维持大脑年轻态的机制,企业合作举办高峰论坛,专家分享前沿研究成果,强调40-60岁是干预黄金窗口期。复合维生素矿物质等营养干预手段显示认知改善潜力,未来需跨学科协作推动大脑抗衰研究普及。

今日大家都在搜的词: