首页 > 业界 > 关键词  > 腾讯混元最新资讯  > 正文

腾讯混元上榜Chatbot Arena排名:跻身全球Top 15

2025-03-20 00:14 · 稿源: 快科技

快科技3月10日消息,腾讯官方发文宣布,腾讯混元首次上榜海外权威大模型竞技场 Chatbot Arena最新排名,跻身全球 Top 15。

Chatbot Arena 发起方 LMSYS Org (加州大学伯克利分校等机构支持的非营利组织)通过官方X账号对腾讯混元的加入表示欢迎。

腾讯混元首次上榜Chatbot Arena排名:跻身全球Top 15

跟其他测评不一样,Chatbot Arena 的测评人是C端用户用户在平台上以匿名方式与多个模型互动,然后投票决定哪个模型更好,从而根据分数生成排行榜。

这种测评也被看成是大模型直接PK的竞技场,简单直接。

腾讯混元首次上榜Chatbot Arena排名:跻身全球Top 15

官方还表示,今年以来,腾讯混元大模型快速迭代。

不久前推出最新版混元Turbo S模型,中文基础能力的表现同样抢眼,在《中文大模型测评基准SuperCLUE 3月报告》中,腾讯混元位列基础模型国内第二,综合实力稳居国内大模型第一梯队。在模型象限中,腾讯混元应用能力排名国内第一,在文本理解与创作、指令遵循以及Agent能力等多个维度刷新最新成绩。

最后,腾讯混元还预告:全新的推理模型T1将在周五晚直播发布。

腾讯混元首次上榜Chatbot Arena排名:跻身全球Top 15

举报

  • 相关推荐
  • OpenAI 说要“誓死”捍卫数亿 ChatGPT 用户的隐私

    OpenAI 强烈反对法院命令保存所有 ChatGPT 日志,包括已删除的聊天记录……

  • 前OpenAI研究员:有时,ChatGPT为了“自救”,会选择牺牲用户

    他对OpenAI最新GPT-4o模型进行的一系列实验。这些实验旨在测试AI是否会偏向“自我保护”,甚至可能以牺牲用户利益为代价……

  • 与 ChatGPT 一起“越陷越深”

    ChatGPT 似乎正在让一些用户走上妄想甚至阴谋论的道路,或者说,至少在某种程度上强化了这类思维模式……

  • 极光旗下EngageLab及GPTBots双品牌通过SOC 2 Type II认证

    极光旗下EngageLab和GPTBots双品牌通过SOC 2 Type II认证,彰显数据安全与国际合规能力。该认证由美国注册会计师协会制定,覆盖安全性、可用性等五大维度,验证了平台在连续数月的稳定运营表现。作为中国领先的客户互动与营销科技服务商,极光通过旗下客户互动平台EngageLab和企业级AI智能体GPTBots,为全球客户提供行业领先的数据安全保障。此次认证巩固了极光在智能客户互动与AI服务领域的行业地位,其客户覆盖科技、金融等多个领域,遍布全球多个国家和地区。

  • OpenAI免费开放ChatGPT记忆功能:用户对话连贯性提升

    OpenAI宣布向所有用户免费开放 ChatGPT 记忆功能(Memory),该功能此前仅限付费订阅用户使用。此次升级显著增强了记忆能力,并强化了隐私控制。 升级后的记忆功能可保存并智能引用用户的过往对话内容(如偏好设置、特定指令、历史对话),使 AI 回复更具连贯性和上下文关联性。 例如,在撰写长篇小说或进行深度金融分析时,ChatGPT能依据此前对话调整风格或提供相关信�

  • OpenAI 或将推出“使用ChatGPT登录”功能,支持第三方应用接入

    “使用 ChatGPT 登录”这一潜在功能,或将帮助 OpenAI 与苹果、谷歌、微软等巨头展开竞争……

  • GPTBots 迎来增强版 DeepSeek-R1-0528 模型

    GPTBots.ai平台宣布集成深度求索(DeepSeek)最新开源模型DeepSeek-R1-0528,该模型在推理能力上媲美OpenAI和Google的顶级模型,性能显著提升:数学竞赛准确率从70%提升至87.5%,编程性能从63.5%提升至73.3%。该模型支持JSON输出与函数调用,可无缝嵌入企业工作流,同时推出轻量级版本DeepSeek-R1-0528-Qwen3-8B,仅需16GB GPU内存即可运行。此次集成将强化GPTBots为企业提供金融、医疗、教育等领域的AI解决方案能力,助力企业构建定制化AI应用。平台秉持开源理念,采用MIT许可协议,支持商业使用与定制开发。

  • AI日报:腾讯混元3D 2.1大模型开源;字节跳动AI Lab负责人李航卸任;OpenAI Codex 全新升级

    本文介绍了AI领域最新动态:1)腾讯开源混元3D2.1大模型,提升3D生成质量;2)OpenAI Codex升级,优化代码生成功能;3)字节跳动AI Lab负责人李航卸任;4)微软发布700个AI应用案例;5)微软推出Code Researcher工具,解决58%系统崩溃问题;6)Observer AI实现屏幕操作自动化;7)Genspark发布AI浏览器;8)麻省理工用AI技术3.5小时修复15世纪名画;9)蚂蚁集团推出开源多模态GPT-4o模型Ming-Omni;10)MagicTryOn视频换衣框架;11)字节跳动发布实时互动AI视频生成模型Seaweed APT2;12)ChatGPT搜索功能升级;13)字节跳动与老凤祥合作开发AI智能眼镜。

  • 极光GPTBots成功完成“生成式人工智能服务登记”

    极光旗下AI开发平台GPTBots.ai近日在广东省网信部门完成生成式人工智能服务登记,成为合规经营的AI服务提供商。该平台严格遵循国家《互联网信息服务深度合成管理规定》和《生成式人工智能服务管理暂行办法》等法规要求,标志着其在技术创新、服务模式和数据安全等方面获得关键合规认可。此次登记体现了极光对法律法规的严格遵守和对安全责任的高度重视,为区域AI生态发展注入新活力。未来,极光将继续优化技术与服务,保障用户权益,推动生成式AI技术的健康规范发展。

  • 当在线教育遇见 Rightbot:数智员工如何重构教育服务范式

    在线教育行业面临人力成本与服务标准化的双重困境,疫情期某平台用户量暴增300%却导致客服响应时间飙升至40分钟,教师人均负责学员突破200人,投诉率激增260%。文章揭示了"规模扩张-人力过载-体验崩塌"的恶性循环本质,指出标准化服务与个性化需求的冲突。通过Rightbot智能助教案例,展示了AI如何重构教育服务:1)构建垂直领域知识图谱,覆盖K12等6大领域;2)情感智能交互,识别学员真实需求并触发个性化策略;3)全链路数据闭环,预测学习风险并优化教学。实验数据显示,采用AI的机构教师人效提升275%,学员完课率提高58%,满意度从72分升至89分。文章提出未来教育将走向人机协同,让教师专注20%的高价值工作,用技术实现规模化与个性化的平衡。