首页 > 业界 > 关键词  > rStar-Math最新资讯  > 正文

重大突破!微软发布“自我进化”,帮小模型超OpenAI-o1

2025-01-10 08:47 · 稿源: ​ AIGC开放社区公众号

微软亚洲研究院发布了一种创新算法——rStar-Math。rStar-Math通过代码增强CoT、蒙特卡洛树搜索等,可以帮助小参数模型在不依赖老师模型蒸馏的情况下,实现多轮自我思维深度进化,极大增强模型的数学推理能力。在美国数学竞赛AIME2024测试中,rStar-Math平均解决了53.3%(8/15)的

......

本文由站长之家合作伙伴自媒体作者“​ AIGC开放社区公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 刚刚,OpenAI发布o1模型突破,推理时间增强对抗鲁棒性

    今天凌晨2点,OpenAI发布了一项新技术研究,通过增加推理时间、算力资源来大幅度提升模型的对抗鲁棒性。与传统的对抗训练样本方法不同的是,OpenAI提出的新方法不需要对大模型进行专门的对抗训练,也不需要提前了解攻击的具体形式。同样模型在增加推理时间、算力情况下成功抵御攻击。

  • 科大讯飞:纯国产算力的星火X1新版本要来了 能力OpenAI o1

    近日,在一次机构调研中,科大讯飞透露了其最新的研发进展:公司正在全力训练的纯国产算力平台星火X1”新版本,预计将在未来三个月内完成。这一新版本的发布,预期就可以实现数学答题和过程思维链能力全面对标甚至超过OpenAIo1。星火X1仅用1万张910B国产算力卡,就取得一系列研发成果,背后是科大讯飞在国产算力平台大量无人区适配和效率优化工作,真正将国产算力发挥到极致效率,为后续国产大模型适配国产算力开辟了道路。

  • DeepSeek R1有没有赶上OpenAI o1? 八大场景测评结果出炉

    经过一系列测试——从创意写作到复杂的教学,DeepSeek-R1的综合实力完全能和OpenAI的付费「精英」们掰手腕。原来用对方法,性价比路线也能玩转AI竞技场!DeepSeek发布其开放权重的R1推理模型仅一周时间,多次震惊海内外。这场快测的结果让科技媒体arstechnica资深编辑感慨,DeepSeek-R1的综合实力完全能和OpenAI的付费「精英」掰手腕。

  • DeepSeek新模型霸榜,代码能力与OpenAI o1相当且确认开源,网友:今年编程只剩Tab键

    DeepSeek版o1,有消息了。还未正式发布,已在代码基准测试LiveCodeBench霸榜前三,表现与OpenAIo1的中档推理设置相当。这样实时更新、确保公平性和可靠性的测试方法,获得了开发者社区的认可。

  • 性能对标OpenAI o1!DeepSeek R1正式上线英伟达NIM平台

    据英伟达官方网站消息,DeepSeekR1671b版本已作为英伟达NIM微服务的预览版在build.nvidia.com平台上发布。这一微服务基于单个英伟达HGXH200系统,能够实现每秒处理多达3872个token的高效性能。DeepSeekR1是幻方量化旗下AI公司DeepSeek所发布的大型模型,其在数学、代码编写、自然语言推理等多项任务上展现出的性能,足以与OpenAI的o1模型相媲美。

  • OpenAI开启调查:GPT-4o及4o-mini模型性能下降

    据报道,OpenAI发布事故报告指出,当前遭遇GPT-4o和4o-mini模型性能下降问题,目前正在进行调查,并将尽快发布最新消息。科研人员创新性地推出了一项名为LONGPROC的基准测试工具,该工具专为评估模型在处理长上下文中的复杂信息并生成相应回复的能力设计。特别是在需要输出8ktokens的任务中,即便是参数庞大的先进模型也未能幸免于难,这或许预示着未来大型语言模型研究的

  • OpenAI透露明天发布满血版o3

    OpenAI首席全球事务官ChrisLehane在最新专访中透露满血版o3将于本周五正式上线。去年12月20日,在为期12个工作日的线上新品发布活动最后一日,OpenAI宣布了“压轴大作”:o1的下一代模型o3,推出两个版本一个正式的o3,另一个相对较小的精简版o3-mini。不知道此番提前上线满血版o3是否是OpenAI应对DeepSeek热的紧急措施。

  • DeepSeek独立发现o1核心思路,OpenAI首席研究官亲自证实!奥特曼被迫发声

    DeeSeek掀起的滔天巨浪,让全世界为之震颤。从R1复现狂潮,到登顶美榜APPStore,再到科技股集体重挫,这股东方神秘力量威力尽显。它总共包含61个decoder块,其中前三个是全连接层,其余则是专家混合层。

  • 6G就看它了!中国光子毫米波雷达重大突破

    快科技2月5日消息,据南开大学官方消息,近日,该校智能光子研究院祝宁华院士团队与香港城市大学合作,基于兼容CMOS工艺的4英寸薄膜铌酸锂平台,首次设计并构建了集成薄膜铌酸锂光子毫米波雷达,实现了高达厘米级的距离与速度探测分辨率。同时在逆合成孔径雷达二维成像中也达到了厘米级的卓越分辨率,成功突破了电子雷达低频段窄带宽的瓶颈,大幅提升了光子雷达的分辨率和集成度。这是我国目前分辨率最高的片上光子雷达,标志着微波光子雷达发展达到了一个重要的里程碑。微波光子学起步于上世纪70年代,开创了电磁波与光波融合的新领域,?

  • 刚刚,OpenAI发布o3-mini,可免费使用、3大推理模式

    今天凌晨3点,OpenAI正式发布了新模型o3-mini,可在ChatGPT和API中可用。Pro用户可无限使用o3-mini,Plus和Team用户的速率限制将是o1-mini的3倍。o3-mini高推理模式,Plus用户每周只有50条消息?到目前为止我印象不错,本来可以更好,但实际上o3-mini已经很好了。

热文

  • 3 天
  • 7天