首页 > 业界 > 关键词  > GPT-4最新资讯  > 正文

GPT-4完成正确率仅6%,北大等提出首个“多轮、多模态”PPT任务完成基准PPTC

2023-11-08 14:35 · 稿源: 新智元公众号

【新智元导读】为了填补LLM在复杂多模态环境中利用复杂工具完成多轮、多模态指令的评估空白,研究人员引入了PowerPoint任务完成(PPTC)基准测试,以评估LLM创建和编辑PPT文档的能力。最近对大型语言模型(例如ChatGPT和GPT-4)进行的评估工作主要侧重于在基本自然语言任务上的能力

......

本文由站长之家合作伙伴自媒体作者“新智元公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 2025年大模型选型核心指南:Beyond GPT-4,如何理性评估Qwen、DeepSeek等强者?

    大模型选择能力已成为AI时代企业核心竞争力。文章提出“能力-成本-场景”三维评估框架,强调需超越单一指标崇拜,基于客观数据和实际需求进行理性选择。通过Qwen2-Plus与DeepSeek-V3的对比分析,展示不同模型在特定场景下的差异化优势。建议企业建立科学选型流程,采用专业工具进行多维度评估,通过三阶段验证策略确保决策既数据驱动又经实践检验。最终目标是选择最适合业务场景的模型,而非盲目追求流行模型。

  • OpenAI发布语音模型GPT-realtim:具备情感感知能力 多语言无缝切换

    OpenAI正式发布语音模型GPT-realtime。 据介绍,GPT-realtime是一款专注于语音AI Agent的多模态模型,能够生成高度自然流畅的语音,精准还原人类语调、情感和语速的丰富变化。该模型支持图像理解,并可结合语音或文本对话使用,非常适合应用于客服、教育、金融、医疗等领域,用于构建高质量的语音智能体。 官方表示,新模型在复杂指令遵循、工具精确调用以及生成更自然、�

  • AI日报:海螺AI首尾帧功能上线;元石科技发布问小白5;OpenAI发布全新语音模型GPT-Realtime

    AI日报栏目每日提供人工智能领域热点内容,聚焦开发者,帮助洞悉技术趋势、了解创新AI产品应用。最新动态包括:MiniMax海螺AI首尾帧功能上线;元石科技发布问小白5挑战GPT-5;OpenAI推出语音模型GPT-Realtime;谷歌Gemini AI优化表格处理;腾讯黑科技实现AI配音;百度计划培养千万AI人才;MathGPT.ai反作弊功能推广;苹果Xcode集成Claude Sonnet4;微软发布自研AI模型MAI系列;xAI推出高效编码模型Grok Code Fast1;SuperCLUE多模态评测Gemini-2.5-Pro居首;9月1日起AI内容标识新规实施,违规将承担法律风险。

  • 从1920TPS到2400TPS,华为云Tokens服务全面接入384超节点

    华为云在2025年8月27日宣布其Tokens服务全面接入CloudMatrix384超节点,通过xDeepServe架构创新,实现单芯片最高2400TPS吞吐量和50ms低延迟,性能超越业界水平。该服务基于MaaS模式,提供多种规格选择,支持大模型和AI工具,助力企业快速开发AI应用。同时,华为云与超100家伙伴合作,深入行业场景,共建智能生态,加速各行业AI落地。

  • 中国品牌TOP1!海尔壁挂炉逆势增长43%

    2025年上半年中国壁挂炉行业整体销量下滑3.6%,市场趋冷。然而海尔壁挂炉逆势增长43.29%,凭借“双冷凝”节能科技获评“国际领先”技术,解决传统产品高能耗、水温不稳、预热时间长等痛点。其AI智能算法精准控温,配合水联网平台提供全流程解决方案,实现从产品制造到场景服务的跨越,为行业指明节能化、智能化、用户需求导向的发展方向。

  • 用完豆包P图4.0,我在朋友圈就没输过

    文章介绍了作者使用豆包App的Seedream4.0功能对自家小狗照片进行AI编辑的体验。通过精准指令编辑,成功为小狗添加华丽首饰并更换背景,还原度极高。文章对比了Seedream4.0与Nano Banana在图像生成、细节还原和光影处理等方面的表现,认为前者在真实感和用户友好度上更胜一筹。最后指出这类AI工具降低了创意门槛,让人与AI的关系从博弈转向合作。

  • OpenAI CEO:GPT-6将具备个性化记忆 记住用户偏好习惯

    OpenAI的首席执行官萨姆奥尔特曼(Sam Altman)在近日的一次专访中,透露了下一代大模GPT-6的最新进展。他表示,GPT-6 的开发正在积极推进中,其发布节奏将比从GPT-4到GPT-5的周期更快。 奥尔特曼特别强调,GPT-6将不再局限于单纯回答问题,而是朝着与用户深度适配”的方向演进。他举例描述

  • 华为MatePad Mini官宣9月4日发布

    今日,华为正式对外宣布,其首款旗舰小平板——华为MatePad Mini将于9月4日震撼登场,官方Slogan定为“超强,超Mini”,预示着这款新品将在性能与便携性上实现双重突破。 此前,知名数码博主“数码闲聊站”已提前透露,华为MatePad小平板已顺利入网,并定位为全能轻薄型设备。据进一步爆料,该机将采用8.8英寸小尺寸机身设计,搭配16:9比例的OLED屏幕,为用户带来极致的视觉

  • 海宝公司 (Hypertherm Associates) 扩展 XPR® 等离子切割功能,提升生产效率和多功能性

    海宝公司宣布其XPR系列精细等离子系统将在2025年底前迎来多项功能增强,包括全新流线型设计、工业物联网连接、手动设置模式、自动化气刨能力及水雾切割工艺。系统支持以太网和MTConnect协议,提升远程监控与数据交换效率。新增460A水雾切割工艺,可处理更厚材料并实现高质量坡口切割。这些升级旨在提高生产效率、精度和自动化水平,适用于造船、飞机制造及重型设备等领域。

  • 永恒之声,现代演绎 Technics 推出全新直驱式唱盘机SL40C/40CBT

    Technics推出全新SL-40C/40CBT直驱唱盘系统,融合高端机械技术与现代设计。该产品延续品牌经典特性,如无芯直驱电机和高精度S形铝合金唱臂,同时升级外观与易用性。配备预装唱头、内置唱头放大器,支持蓝牙连接(仅40CBT型号),提供三种现代配色。旨在满足HiFi用户和现代家庭音频爱好者的需求,兼顾音质与便捷体验。

今日大家都在搜的词: