首页 > 业界 > 关键词  > 正文

对标GPT-4 Turbo!科大讯飞刘庆峰:理性认识中美差距 绝不能盲目自信

2024-06-30 14:34 · 稿源: 快科技

科大讯飞重磅推出讯飞星火大模型V4.0,在关键指标上超越GPT-4 Turbo。

发布会上,科大讯飞董事长刘庆峰宣布,星火V4.0在文本生成、语言理解、问答、推理和数学等方面达到国际顶尖水平,在8项主流测试中夺冠。

刘庆峰同时指出,尽管取得进步,但星火V4.0在代码和多模态能力上仍落后于GPT-4 Turbo。

刘庆峰强调,面对科技差距,应保持理性态度,避免盲目自信。

他表示,科大讯飞与华为合作打造的国产万卡算力集群为星火提供了强大支持,但与国际先进水平仍需追赶。

刘庆峰表示,星火V4.0的发布只是起点,科大讯飞将持续推动大模型技术发展和应用。

据悉,星火大模型预计于今年8月升级,进一步缩小与国际先进水平的差距。

举报

  • 相关推荐
  • 共创欧美本土品牌破局之路:科大讯飞×出海启明星品牌游学圆满收官

    8月15日,由讯飞AI营销联合出海启明星、万里汇WorldFirst主办的"走进科大讯飞"品牌游学活动在深圳圆满收官。活动聚焦"共创欧美本土品牌营销的破局之路"主题,40余家出海头部品牌负责人通过深度洞察、实战分享与圈层交流,探讨中国品牌全球化进程中的核心痛点。讯飞AI营销展示了其AI驱动的程序化广告平台GrowOne、红人营销平台iFLYTalent等解决方案,已服务1800+客户,覆盖20亿用户和100个国家。活动通过行业大咖实战经验分享,为出海企业提供了从产品营销到品牌落地的全链路策略,助力中国品牌突破全球化壁垒,实现从本土品牌到"全球爆款"的跨越。

  • OpenAI和科大讯飞,瞄准了同一件事

    OpenAI正式发布GPT-5大模型,距离GPT-4推出已29个月。GPT-5虽仍是当前最全面的模型,但性能提升未与主流模型拉开显著差距,部分场景甚至被Grok4和Claude+Opus4.1超越。OpenAI强调此次升级重点在于减少幻觉、提升指令遵循能力和降低模型谄媚性,而非单纯追求性能突破。与此同时,国产大模型代表星火X1也在7月25日升级,同样聚焦解决幻觉问题,在事实性幻觉和忠诚性幻觉治理上取得突破。全球顶尖大模型正从"能用"向"好用"转变,OpenAI和科大讯飞都通过多目标奖励机制和思维链监控等技术手段改善模型可靠性。星火X1已全面赋能教育、医疗、企业应用等行业,在复杂场景任务上满足用户核心需求。大模型产业已进入规模化落地关键期,中国人工智能产业正从追赶走向领先阶段。

  • 2025年大模型选型核心指南:Beyond GPT-4,如何理性评估Qwen、DeepSeek等强者?

    大模型选择能力已成为AI时代企业核心竞争力。文章提出“能力-成本-场景”三维评估框架,强调需超越单一指标崇拜,基于客观数据和实际需求进行理性选择。通过Qwen2-Plus与DeepSeek-V3的对比分析,展示不同模型在特定场景下的差异化优势。建议企业建立科学选型流程,采用专业工具进行多维度评估,通过三阶段验证策略确保决策既数据驱动又经实践检验。最终目标是选择最适合业务场景的模型,而非盲目追求流行模型。

  • iQOO Z10 Turbo+首销战绩公布:为Z10 Turbo Pro的174%

    iQOO品牌正式发布了其全新旗舰机型iQOO Z10Turbo+,并同步开启销售。这款新机以其卓越的性能和超长续航能力迅速吸引了市场关注,官方数据显示,其首销成绩达到了此前Z10Turbo Pro的174%,显示出消费者对其的高度认可。 iQOO Z10Turbo+的核心亮点在于其搭载的8000mAh超大容量电池,这在当前的智能手机市场中极为罕见。该机型不仅配备了天玑9400+旗舰处理器,还配备了旗舰级的LPDDR5X U

  • 中国UP主成为不了MrBeast

    影视飓风创始人Tim刚刚结束的“100小时荒岛直播挑战”,无疑是一次B站在这个夏天难得的现象级事件——B站累计超过四千万观众进入直播间,全平台总观看量超过两亿,弹幕数以百万计,甚至带动了直播带货的即时转化。 从数据到热搜,此次直播堪称完美演绎了“爆款”的逻辑。 质疑声同样随之而来:这场直播与其说是“荒岛生存”,不如说是“带电度假”;也评论认为,它

  • 豆包1.5 Vision Lite 对比 GPT-5-min,谁更适合你?实测AI模型选型利器|AIBase

    文章探讨了企业选择AI大模型时面临的实际决策难题,指出单纯比较学术参数无法满足业务需求。AIBase模型对比平台(https://model.aibase.cn/compare)通过三大核心价值解决痛点:1)聚焦业务场景而非参数堆砌,突出价格、语言支持、上下文长度等实用维度;2)透明化成本计算,标注长文本溢价规则和多模态附加费;3)一键生成对比报告。平台特别强调中文场景的特殊性(如豆包1.5在中文处理成本的优势),并揭示厂商宣传中容易忽略的隐藏成本(如GPT-5-min超5000字符的30%溢价)。典型电商客服案例显示,需综合中文理解、多模态、性价比等维度决策,最终选择取决于具体业务需求而非绝对性能排名。

  • 智检未来 触手可及——CASIVIBOT工业质检机器人震撼发布

    8月19日,中科慧远发布首款工业具身质检机器人CASIVIBOT,以“具身智能”为核心,融合人类质检经验与AI技术,实现灵活操作与高效检测。该机器人采用“手-眼-脑”协同架构,支持多行业复杂场景应用,具备快速部署和持续进化能力,旨在推动工业质检智能化升级,提升检测效率与灵活性。

  • 中国冰箱业TOP5型号4款是海尔

    2025年7月冰箱行业零售额、零售量增速放缓,环比下降34.5%和29.1%。行业承压加剧,多数品牌负增长,仅海尔冰箱逆势增长9.1%。海尔凭借爆款产品带动增长,TOP5型号中占4款,均为主打高端十字门冰箱。其磁控全空间保鲜技术获国家科技奖,显著延长食材保鲜期。通过全流程数字化升级,海尔实现运营效率提升,以科技驱动和用户体验赢得市场,为行业提供增长启示。

  • OpenAI CEO:GPT-6将具备个性化记忆 记住用户偏好习惯

    OpenAI的首席执行官萨姆奥尔特曼(Sam Altman)在近日的一次专访中,透露了下一代大模GPT-6的最新进展。他表示,GPT-6 的开发正在积极推进中,其发布节奏将比从GPT-4到GPT-5的周期更快。 奥尔特曼特别强调,GPT-6将不再局限于单纯回答问题,而是朝着与用户深度适配”的方向演进。他举例描述

  • GPT5上线大翻车!用户强烈呼吁使用旧版 OpenAI重新上线GPT4o

    OpenAI发布最强AI模型GPT-5,但引发用户强烈不满。新模型上线后反应速度变慢、回答质量下降,且官方突然下架GPT-4o等8个旧模型,导致付费用户抗议。部分用户对旧版产生情感依赖,认为GPT-4o更具人性化温暖。第三方测试显示GPT-5在复杂任务上虽有提升,但交互体验明显退步。CEO承认低估用户对旧版的喜爱,承诺将恢复部分旧模型并提供更多定制服务。专家指出大模型边际效益递减,面临数据质量和算力成本限制。总体而言,GPT-5在技术指标进步的同时,牺牲了情感交互体验。

今日大家都在搜的词: