首页 > 业界 > 关键词  > 微软Phi-4最新资讯  > 正文

微软Phi-4封神,14B小模型数学击败GPT-4o,合成数据占比40%,36页技术报告出炉

2024-12-23 08:53 · 稿源: 新智元公众号

微软下一代14B小模型Phi-4出世了!仅用了40%合成数据,在数学性能上击败了GPT-4o,最新36页技术报告出炉。140亿参数,40%合成数据,年度SLM之王诞生!最近,微软下一代小模型Phi-4正式亮相。在GPQA和MATH基准上,其数学性能直接碾压GPT-4o、Gemini Pro1.5。而且,Phi-4粉碎了其他小模

......

本文由站长之家合作伙伴自媒体作者“新智元公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 有道14B低成本轻量模型“子曰3”开源,数学推理性能超越大模型

    网易有道6月23日开源国内首个专注数学教育的"子诳3"大模型系列数学模型(Confucius3-Math)。该模型在单块消费级GPU上高效运行,在多项数学推理任务中性能超越更大规模的通用模型,高考数学题测试得分达98.5分。其训练成本仅2.6万美元,推理性能是DeepSeek+R1的15倍,服务成本低至每百万token0.15美元,大幅降低教育AI应用门槛。该开源模型为教育公平提供低成本、高性能的AI�

  • 真学霸!豆包大模型1.6正式发布:高考数学卷获144分 全国第一

    今日,字节跳动旗下火山引擎举办FORCE原动力大会,正式发布豆包大模型1.6。 新系列包括三个大模型,分别是Doubao-Seed-1.6-thinking、Doubao-Seed-1.6、Doubao-Seed-1.6-flash。 火山引擎总裁谭待表示,Doubao-Seed-1.6是首个支持256k长上下文的大模型。 以thinking模型为例,其思考能力强化,支持多模态,Doubao-Seed-1.6则支持on/off/auto三种思考模式。 在高考全国新一卷数学单科测试中,豆包大模�

  • 理想汽车OTA7.4正式推送!自研MindGPT-4o-preview模型首次上车

    理想汽车5月28日发布OTA 7.4版本升级,主要亮点包括:1)首次搭载自研MindGPT-4o大模型,智能助手"理想同学"升级为3D毛绒形象,新增双手交互动作,语音交互更自然生动;2)新增"小同桌"多角色对话功能,支持连续聊天和情商引导;3)升级为生活助手Agent,能自主操作车机完成复杂任务,支持支付宝小程序操作;4)新增家庭账号系统、面容识别和对话历史功能;5)影音体验优化,支持前后排独立音区;6)推出儿童节专属"小主人"模式,新增斑马百科应用;7)新增超充站降锁、冰箱定时开关等实用功能;8)优化L6车型CDC悬架系统,提升操控性。

  • 难哭了的高考数学题,4家国产大模型表现如何?

    2025年高考数学考试引发热议,多家AI大模型参与测试。腾讯元宝和豆包表现最优,分别获得145分和140分(满分150分),仅错1-2道题。文心一言和QWen3稍逊,得分在120分左右。测试显示,AI在选择题和基础解答题表现良好,但在涉及图像理解、向量分析等复杂题目时仍存在困难。特别是一道包含向量图的"杀手题"让所有AI失分。专家指出,国产大模型数学能力已有显著提升�

  • 美国女孩喂流浪犬遭40只狗围咬致死:14只被实施安乐死

    远离流浪狗!尤其是身材娇小的儿童和女性,因为更容易激发它们的狩猎本能。 海外媒体报道,近日在美国阿肯色州亚历山大市,15岁少女马凯拉佛特纳喂食流浪犬时,遭40只狗围攻致死。 有目击者称,警察刚靠近一处私人住宅围栏,就有一大群狗冲过来,直到他掏出配枪朝地面开了两枪才让狗群四散逃离,而死亡的女孩就躺在不远处地面上。 几个月来,邻居们一直抱怨这�

  • 韦神4秒视频引爆2400万粉丝,一场“知识IP”和平台的合谋?

    一条仅有4秒的视频,掀起了这个夏天最猛烈的一次“知识流量”风暴。 6月4日晚,北京大学助理教授韦东奕在抖音上传了一则极简自我介绍,迅速在全网引爆热度,24小时内粉丝破千万。截至目前,该账号已斩获超过2400万粉丝,成为现象级的出圈案例。 表面看,这是一个“学术清流”偶然踏入流量池的故事。但深入拆解,其背后是用户情绪、高考节点、社交共鸣与平台机制�

  • 京东公布2024年ESG报告:一线员工超40万 80%来自农村

    京东最新发布了2024年ESG报告,其中公布了诸多员工数据。 就业生态构建上,过去三年,超5万个面向在校生的岗位、300余种岗位类型,为青年职业启航拓宽路径。 超40万一线员工中,80%来自农村地区,助力乡村人才融入城市发展浪潮,还吸纳了超4500名残疾员工。

  • AI日报:豆包大模型1.6发布;OpenAI推o3-pro模型、o3价格暴降80%;Figma官方MCP重磅上线

    【AI日报】今日AI领域重要动态:1)火山引擎发布豆包大模型1.6和视频生成模型Seedance1.0pro,性能显著提升;2)OpenAI推出o3-pro模型,专注可靠性但响应较慢;3)Figma推出Dev Mode MCP服务,实现设计到代码一键转换;4)Krea AI发布图像生成模型Krea1,解决传统AI绘图问题;5)火山引擎豆包日调用量突破16.4万亿次;6)法国Mistral发布推理模型Magistral;7)苹果系统整合ChatGPT图像生成功能;8)OpenAI大幅下调o3价格80%并推出o3-pro;9)Hugging Face开源榜单显示中国团队Qwen与DeepSeek进入全球前15;10)阿里开源MaskSearch框架,提升AI解决复杂问题能力。

  • 北大韦神开账号了:现身4秒 说了14个字 吸粉2.4万

    近日,据短视频平台抖音显示,北大韦神韦东奕开通了个人社交账号。 截至目前,该账号仅有一条4秒的出镜视频,韦东奕本人在视频中简单介绍了一下自己:大家好,我叫韦东奕,这是我的账号。截止6月6日11:30分,该账号吸粉2.4万。 据媒体从韦东奕堂哥处了解,该账号确为韦东奕本人账号,系家人协助申请,后续,将分享数学相关内容,使韦东奕与外界有更多接触。 北�

  • 高考724分女生:平时数学也常满分 学数学很有乐趣

    6 月 25 日,河南开封传来喜讯,开封高中学生代易瓒在物理类高考中取得了 724 分的优异成绩。其中,她的数学成绩更是满分,化学和物理也分别取得了 99 分和 98 分的高分。 ​代易瓒表达了自己对数学的深厚喜爱。她表示,数学是她一直热爱的学科,在学习过程中也给她带来了很多乐趣和成就感。