首页 > 业界 > 关键词  > GPT-4o最新资讯  > 正文

长上下文能力只是吹牛?GPT-4o正确率仅55.8%,开源模型不如瞎蒙

2024-07-23 17:11 · 稿源: 新智元公众号

【新智元导读】当今的LLM已经号称能够支持百万级别的上下文长度,这对于模型的能力来说,意义重大。但近日的两项独立研究表明,它们可能只是在吹牛,LLM实际上并不能理解这么长的内容。大数字一向吸引眼球。千亿参数、万卡集群,——还有各大厂商一直在卷的超长上下文。从一开始的

......

本文由站长之家合作伙伴自媒体作者“新智元公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 百度文心大模型X1.1正式发布:超越DeepSeek R1、打平GPT-5

    今天,在WAVE SUMMIT深度学习开发者大会2025上,百度文心大模型X1.1正式发布,在事实性、指令遵循、智能体等能力上均提升显著。 百度王海峰介绍,文心大模型X1是基于文心大模型4.5训练而来的深度思考模型,升级后的X1.1主要采用了迭代式混合强化学习训练框架。 一方面通过混合强化学习,同时提升通用任务和智能体任务的效果;另一方面通过自蒸馏数据的迭代式生产及训练

  • OpenAI发布语音模型GPT-realtim:具备情感感知能力 多语言无缝切换

    OpenAI正式发布语音模型GPT-realtime。 据介绍,GPT-realtime是一款专注于语音AI Agent的多模态模型,能够生成高度自然流畅的语音,精准还原人类语调、情感和语速的丰富变化。该模型支持图像理解,并可结合语音或文本对话使用,非常适合应用于客服、教育、金融、医疗等领域,用于构建高质量的语音智能体。 官方表示,新模型在复杂指令遵循、工具精确调用以及生成更自然、�

  • 从1920TPS到2400TPS,华为云Tokens服务全面接入384超节点

    华为云在2025年8月27日宣布其Tokens服务全面接入CloudMatrix384超节点,通过xDeepServe架构创新,实现单芯片最高2400TPS吞吐量和50ms低延迟,性能超越业界水平。该服务基于MaaS模式,提供多种规格选择,支持大模型和AI工具,助力企业快速开发AI应用。同时,华为云与超100家伙伴合作,深入行业场景,共建智能生态,加速各行业AI落地。

  • 中国品牌TOP1!海尔壁挂炉逆势增长43%

    2025年上半年中国壁挂炉行业整体销量下滑3.6%,市场趋冷。然而海尔壁挂炉逆势增长43.29%,凭借“双冷凝”节能科技获评“国际领先”技术,解决传统产品高能耗、水温不稳、预热时间长等痛点。其AI智能算法精准控温,配合水联网平台提供全流程解决方案,实现从产品制造到场景服务的跨越,为行业指明节能化、智能化、用户需求导向的发展方向。

  • 抢占下一代用户入口,百年B&O被曝携手雷鸟创新押注AR赛道

    丹麦百年音响品牌Bang & Olufsen将于10月发布首款AR眼镜,或与中国AR企业雷鸟创新联合打造。这标志着传统音频巨头进军AR赛道,布局下一代用户入口。B&O凭借顶级声学技术与高端用户体验积累,结合雷鸟在AR光学方案和量产能力的优势,双方合作将推动AR设备从功能满足向极致体验迈进,巩固中国AR技术的国际化输出。

  • 用完豆包P图4.0,我在朋友圈就没输过

    文章介绍了作者使用豆包App的Seedream4.0功能对自家小狗照片进行AI编辑的体验。通过精准指令编辑,成功为小狗添加华丽首饰并更换背景,还原度极高。文章对比了Seedream4.0与Nano Banana在图像生成、细节还原和光影处理等方面的表现,认为前者在真实感和用户友好度上更胜一筹。最后指出这类AI工具降低了创意门槛,让人与AI的关系从博弈转向合作。

  • 字节跳动发布 Seedream 4.0 图像创作模型,豆包App可免费体验

    字节跳动Seed团队推出豆包图像创作模型Seedream4.0,支持文生图、图像编辑及多图参考等功能,在专业评测中达到业界领先水平。该模型已上线豆包App、即梦AI等平台供用户免费体验,并通过火山引擎开放给企业客户。Seedream4.0具备多模态创意能力,可生成4K分辨率商用图像,适用于教育、电商、广告设计等场景。团队表示将持续探索实时交互生成体验,深度融合多模态推理与世界知识。

  • 苹果官网Apple Store开始维护!iPhone 17系列今晚开启预购

    苹果年度新品预售即将拉开帷幕。今晚8点,iPhone17、iPhone17Pro及iPhone17Pro Max三款机型将在苹果官网及授权渠道同步开启预购。 目前,苹果官网Apple Store页面已进入维护状态,系统提示将于北京时间20:00准时开放订购,首批成功下单的用户预计最快可在9月19日(周五)清晨收到新机。

  • 苹果发布AirPods Pro 3 售价249美元:支持实时翻译、心率监测

    今日,苹果公司正式发布全新无线耳机AirPods Pro3,凭借其卓越的主动降噪能力、创新的实时翻译功能以及贴心的健康监测特性,一经亮相便吸引了众多消费者的目光。 在主动降噪方面,AirPods Pro3堪称行业翘楚。苹果宣称,其主动降噪能力是前代产品的两倍,更是初代效果的四倍,为用户营造出极致静谧的聆听环境,无论是身处嘈杂的街头,还是喧闹的公共交通场所,都能让用

  • 旧款Apple Watch也将支持高血压警报:涉及这三款

    苹果在发布Apple Watch Series11与Ultra3两款新品之际,同步宣布了一项惠及旧款用户的重大更新——通过即将到来的watchOS26系统升级,Apple Watch Series9、Series10以及Ultra2三款旧机型也将新增高血压警报功能。这一举措意味着,部分持有旧款设备的用户无需更换新表,即可享受到这一前沿的健康监测服务。 watchOS26正式版定于9月15日正式向全球用户推送。新增的高血压警报功能依托于Appl

今日大家都在搜的词: