首页 > 业界 > 关键词  > ChatGPT最新资讯  > 正文

图灵测试已死!ChatGPT通过人类考试也不算,超强AI评估新秀「逻辑谜题」

2023-09-01 11:57 · 稿源: 新智元公众号

【新智元导读】如何给大模型一个真正公平评价标准呢?世界最强AI——ChatGPT可以通过各种考试,甚至输出回答让人难以辨别真假。然而,它也有力所不及之处,那便是解决简单的视觉逻辑难题。在一项由屏幕上排列的一系列色彩鲜艳的块组成的测试中,大多数人都能找出连接的图案。但是,

......

本文由站长之家合作伙伴自媒体作者“新智元公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 女子用ChatGPT选号中百万大奖 全部捐出帮助有需要的人

    美国弗吉尼亚州女子卡丽爱德华为非经常购彩者,近日通过手机向ChatGPT询问彩票号码建议,AI提供几组数字供参考。她购买后幸运中得15万美元(约106万元人民币)大奖。领奖时她当场宣布将全部奖金捐出,帮助有需要的人,并表示自己已足够幸运,希望以此鼓励其他中奖者回馈社会。

  • OPPO Watch S官宣:轻薄表皇

    OPPO宣布将于10月16日推出OPPO Watch S智能手表,主打“轻薄表皇”设计,厚度不足9mm,号称目前市面上最薄的智能圆表。搭载全新智能手表系统,操作体验媲美手机,健康配置亦有惊喜。同时具备“健身教练”功能,可自动识别运动并提供超100种运动模式,专业记录数据。此外,发布会还将推出OPPO Find X9和X9 Pro旗舰手机,首批搭载联发科天玑9500平台,出厂预装全新ColorOS 16系统。

  • AI日报:快手推出AI视频制作助手Kwali;字节跳动推出USO模型;OpenAI推出ChatGPT开发者模式

    本文介绍了AI日报栏目,聚焦AI领域最新动态。快手推出Kwali视频助手,简化视频制作流程;字节跳动发布USO模型,解决图像生成中风格与主题的矛盾;微软推出Copilot Audio音频模式,提供个性化语音交互;Stability AI升级Stable Audio 2.5,支持高质量音频生成;阿联酋推出开源大模型K2 Think,拥有320亿参数;微信上线智能回复功能,提升公众号运营效率;OpenAI推出ChatGPT开发者模式,支持AI控制外部工具;字节跳动Seed团队发布AgentGym-RL框架,提升语言模型决策能力;月之暗面开源Checkpoint Engine中间件,优化LLM推理效率;B站开源IndexTTS-2.0文本转语音系统,支持情感与时长控制;Replit推出Agent 3编程助手,自主性提升10倍。

  • 华为WATCH GT 6/Pro系列手表发布 售价1488元起

    华为于9月24日正式发布WATCH GT6系列智能手表,起售价1488元。该系列提供41mm和46mm两种尺寸,搭载OLED屏幕,续航最长可达21天,支持5ATM防水和IP69防尘。GT6 Pro新增跌倒检测、ECG心电图分析及专业运动模式,并配备蓝宝石玻璃表镜。全系采用高硅叠片电池技术,能量密度提升37%,支持无线快充。此外,首次应用骑行模拟功率功能,并搭载TruSense技术,精准监测心率、血氧等健康指标。GT6 Pro起售价2488元,进一步满足专业用户需求。

  • HUAWEI WATCH GT 6系列全新发布: 驭风而行 实力进阶

    9月24日,华为发布HUAWEI WATCH GT 6智能手表,主打“驭风而行”理念,兼顾运动健康与时尚设计。新品搭载全新高硅叠片异形电池,续航大幅提升,Pro版最长可达21天。升级版向日葵定位系统提升定位精度20%,新增骑行模拟功率功能,适配越野跑、滑雪等户外场景。健康管理全面升级,支持12种情绪识别及房颤负荷统计功能。设计上,Pro版采用立式计时表圈,46mm款灵感源自骑行,41mm款更小巧轻盈。售价1488元起,9月29日正式开售。

  • 苹果Apple Watch高血压通知功能上线

    苹果公司宣布将在全球150多个市场推出Apple Watch高血压通知功能,该功能将随watchOS 26和iOS 26系统更新正式推送。目前英国、法国、德国等地区用户已可体验,但加拿大等部分市场尚未开放,中国大陆地区仍需等待监管审批。该功能依托光学心率传感器,可实时监测用户血管对心跳的反应,识别慢性高血压迹象,并在检测到异常时发出提醒。系统会分析用户最近30天的数据,通过先进算法判断是否需要发出通知。

  • StarRocks Connect 2025 圆满落幕:AI Native 时代,数据分析未来已来

    StarRocks Connect 2025峰会圆满落幕,聚焦AI Native时代的数据分析未来。活动汇聚全球开发者与行业专家,分享StarRocks在复杂业务场景中的实践,探讨技术演进方向。从性能引擎到AI原生平台,StarRocks 4.0将支持多智能体协作框架,提升数据分析效率。多家企业展示应用案例,覆盖电商、金融、旅游等领域,验证了其高性能与成本优势。开源精神推动技术创新,共同探索数据智能的无限可能。

  • 美团发布高效推理模型LongCat-Flash-Thinking:部分性能接近GPT5

    9月23日,美团LongCat团队发布全新高效推理模型LongCat-Flash-Thinking。该模型在保持极致速度的同时,性能更强大、更专业,在逻辑、数学、代码、智能体等多个领域的推理任务中达到全球开源模型最先进水平(SOTA),部分任务性能接近闭源模型GPT5-Thinking。它增强了智能体自主调用工具能力,扩展了形式化定理证明能力,成为国内首个结合深度思考、工具调用与非形式化、形式化推理的大语言模型。在数学、代码、智能体等高复杂度任务上表现尤为突出,多项基准测试成绩领先开源及闭源顶尖模型,已在HuggingFace、Github全面开源。

  • 浪漫自在,悦己之声 森海塞尔ACCENTUM Open 真无线耳机 樱花粉上市

    森海塞尔于2025年9月22日在北京发布ACCENTUM Open真无线耳机樱花粉配色。新品在保持卓越音质的同时,以柔和樱花粉点缀耳畔,融合半开放式声学结构与舒适贴耳设计,支持蓝牙5.3多设备连接、双麦克风降噪及28小时续航。耳机单只仅重4.35克,配备IPX4防水,兼顾轻盈佩戴与全天候使用。樱花粉作为继经典黑白后的新配色,将于9月28日正式发售。森海塞尔强调其致力于创新音频解决方案,2025年正值品牌创立80周年,持续为客户打造独特声音体验。

  • 华为穿戴音频新品发布会定档9月24日:WATCH GT6等将发布

    今日,华为官方正式宣布,将于9月24日举办穿戴音频新品发布会,届时备受期待的华为WATCH GT6系列智能手表与华为FreeClip2耳夹耳机二代将同台登场,引发科技圈与消费者的高度关注。 作为本次发布会的重头戏,华为WATCH GT6系列将成为GT系列首款支持星闪技术的智能手表。据透露,该系列预计推出WATCH GT6和WATCH GT6Pro两款机型,覆盖41mm至46mm表盘尺寸,满足不同用户需求。其中,�

今日大家都在搜的词: