首页 > 业界 > 关键词  > AI编码工具最新资讯  > 正文

微软推出微型AI自动编码模型phi-1,击败 GPT-3.5

2023-06-26 10:16 · 稿源:站长之家

站长之家(ChinaZ.com)6月26日 消息:微软的人工智能研究人员发布了一种新的、轻量级的代码生成模型 phi-1,并且其性能优于 ChatGPT 背后的大型语言模型 GPT-3.5。

据了解, 这个基于 Transformer 的模型仅拥有13亿个参数,相比之下,Codex拥有120亿个参数。

微软的研究人员仅用了四天时间就使用 Nvidia 的8个 A100芯片来训练 phi-1。该模型使用来自网络的60亿个token以及使用 GPT-3.5生成的另外10亿个token进行训练。

在性能方面,phi-1在HumanEval基准测试中获得了50.6% 的 pass@1准确率。尽管模型小得多,但微软模型击败了 Hugging Face 和 ServiceNow 的 StarCoder (33.6%)、OpenAI 的 GPT-3.5(47%) 和谷歌的 PaLM2-S (37.6% ) 。

在MBPP pass@1测试中,phi-1表现更好,取得了55.5% 的分数。上述许多模型尚未发布该基准测试的结果,但 WizardLM 的WizardCoder在本月早些时候进行的测试中得分为51.5%。WizardCoder 是一个150亿个参数模型,而 phi-1的参数模型为13亿个。

病毒、代码 (4)

高质量数据带来差异

微软的研究人员认为,正是“高质量数据的力量”让 phi-1表现如此出色。为了说明这一点,研究人员将他们模型的论文命名为“教科书就是你所需要的”。

他们写道:“正如一本全面、精心制作的教科书可以为学生提供掌握新学科所需的知识一样,我们的工作展示了高质量数据在磨练语言模型在代码生成任务中的熟练程度方面的显着影响。” 。

“通过制作‘教科书质量’数据,我们能够训练出一个模型,尽管模型大小缩小了10倍,数据集大小缩小了100倍,但在编码基准(例如 HumanEval 和 MBPP)上,该模型超越了几乎所有开源模型。”

与其他可用的编码模型相比,Phi-1仅限于 Python 编码。他们表示,该模型的局限性还在于它缺乏大型模型的特定领域知识,例如使用特定 API 进行编程。

为了扩展他们的工作,微软的研究人员建议使用 GPT-4而不是 GPT-3.5来生成用于模型训练的合成数据。

研究人员还将寻求提高数据集的多样性和非重复性,尽管该团队表示,他们必须找到方法“在数据生成过程中注入随机性和创造力,同时仍然保持示例的质量和连贯性。”

举报

  • 相关推荐
  • TOP1后再加码!海尔麦浪冰箱登陆东南亚

    海尔冰箱在东南亚市场表现强劲,2025年上半年市场份额位居第一,大冰箱销量增幅超50%,在泰国、越南、菲律宾等国增速均超40%。8月推出的海尔麦浪冰箱针对当地需求特点:采用594mm超薄嵌入式设计适应小户型;配备多温区保鲜技术,实现果蔬7天新鲜;创新"冰饮自由"功能,搭载智能制冰技术,饮料存储高度达230mm。产品还针对热带气候优化,采用专业散热设计,并推出奶油白与阳光金配色方案。该系列在国内上市9个月销量突破70万台,618期间成为8K+价位段TOP1型号。

  • 老板电器以“AI+烹饪”,解锁“第一网鱼”的鲜美密码

    福建东山岛开渔季启动,当地"第一网鱼"因休渔期生态调节肉质鲜美。老板电器推出AI全自动烹饪一体机,通过食神AI大模型精准识别食材并匹配最佳烹饪方案,创新湿度探针实时监测四维数据确保火候精准。其24.1L/min澎湃蒸汽系统能快速锁鲜,将蒸制时间缩短至5分钟,完整保留海鲜的鲜甜本味。该技术破解了极致鲜味的烹饪密码,让用户轻松掌握烹饪精髓,开启智能厨房新篇章。

  • AI工具导航网站哪个好?如何更快找到真正适合自己的高效AI工具?AIbase帮你解决难题

    AIbase导航平台致力于帮助用户快速精准地找到优质AI工具。通过严格筛选与分类,提供主流高效工具,避免信息冗余。支持多维度深度对比,包括核心功能、模型基础、价格及用户真实评价,助用户理性选择。一键直达官方入口,省去繁琐步骤,确保安全可靠。适合AI新人、效率追求者及专业人士使用,提升工作效率,降低试错成本。

  • 将AI大模型费用计算器作为战略工具:企业如何规避AI项目的成本陷阱

    AI项目规模化应用面临不可预测的运营成本挑战,尤其是大模型API调用费用难以精准预测,导致项目ROI计算失效。成本失控源于计费维度复杂、价格变动频繁及用户行为影响。领先企业通过成本管控前移,在项目可行性分析阶段引入AIbase等成本计算工具,实现成本可视化,支持技术选型和预算建模,从被动应对转向主动管理,提升AI应用的经济性和可持续竞争力。

  • 哪里找最新AI工具官网?如何快速对比ChatGPT替代品?AI工具导航指南 - AIbase

    文章探讨了在AI工具爆炸式增长的时代,用户面临的信息过载和筛选困难问题。主要内容包括:1)AI领域迭代速度远超传统软件,个人追踪信息效率低下且容易错过关键更新;2)AIbase.cn平台致力于解决这一问题,通过聚合主流AI工具、严格审核信息来源、持续更新行业动态;3)平台提供多维对比功能,结构化呈现工具参数,帮助用户快速定位适合需求的解决方案;4)建议用户定期浏览平台资讯栏目,善用搜索筛选功能,通过对比视图做出明智选择。核心价值在于降低信息筛选成本,让用户更高效地获取有价值的AI工具和前沿资讯。

  • 山石网科叶海强解码“双A战略”:ASIC 解放算力、AI 解放人力

    山石网科通过自主研发ASIC安全专用芯片实现战略变革,构建"双A战略"(ASIC+AI)突破行业同质化竞争。其ASIC芯片将高频调用代码固化,释放CPU算力,显著提升系统性能与稳定性,同时通过AI优化研发流程和服务效率,实现人力成本降低。公司规划2023-2025年完成全产品线向ASIC平台切换,2026-2028年进入规模跃升期,目标收入突破20亿元。山石网科强调不盲目追逐AI风口,而是聚焦"流程优化",通过AI提升编码效率30%,运维问题解决效率提升25%。这种"技术筑基、效率突围"的策略,正在帮助公司在行业洗牌中构建差异化竞争优势。

  • 如何快速找到最适合的AI绘画工具?避免在200+工具中挑花眼?

    某电商设计团队为生成产品场景图,测试18款AI绘画工具后发现:部分工具出图快但细节差,有的支持中文但训练数据老旧。最终耗时两周选定Stable Diffusion+特定LoRA模型。行业存在信息过载、同质化严重、参数混乱等问题。AIbase导航站通过三重过滤机制(人工初筛、多维度对比、直达官网)帮助用户高效选型。实际案例显示,跨境团队用此方案节省21天试错时间,首月成本降低67%。工具筛选能力比掌握工具更重要,让创造力真正释放。

  • 知名数码品牌倍思发布BF1耳挂式耳机:在轻盈中唱响天籁

    倍思推出BF1耳挂式耳机,主打轻量化设计,单耳仅重7.5g,采用0.6mm超细钛丝和全包裹硅胶材质,佩戴舒适稳固。产品搭载17mm超长跑道型动圈单元,支持Hi-Res、QQMusic、LDAC三大平台金标音质认证,配备SuperBass超感低音引擎,覆盖20Hz-40kHz超宽频响。具备IPX7级防水、45小时续航、物理按键操控等实用功能,采用微距腔定向聚音架构实现<29dBA防漏音水平。这款百元级开放式耳机凭借创新技术和超高性价比,在天猫新品榜蝉联榜首两周,重新定义了高端舒适体验新标准。

  • AI最新资讯在哪里看?AIbase:高效获取国内外AI新闻头条与行业动态

    文章探讨了AI时代信息过载的困境:有价值的前沿动态、重磅模型发布和行业解读分散各处,筛选成本高、效率低下。AIbase资讯导航站应运而生,通过四大核心功能解决痛点:1)聚合主流信源,过滤低质噪音;2)结构化分类呈现大模型动态、行业应用等六大板块;3)提炼核心要点,拒绝标题党;4)高频更新确保信息鲜度。该平台致力于成为AI领域的"信息雷达",帮助用户节省70%信息搜集时间,将精力聚焦于思考与创造。适用于技术负责人快速掌握行业动态、产品经理调研案例、投资人捕捉趋势等多元场景。

  • 这个为全民造梦的AI工具,正在改写影视行业的规则

    ​过去一年,AI视频技术开启了一个全民造梦时代。 从OpenAI的视频生成模型Sora“技惊四座”的Demo,到快手旗下的可灵AI“后来者居上”,整个影视行业仿佛瞬间被推入了一个全新的纪元。 如果我们把电影工业史的坐标轴拉长,会发现它就是由一个个技术变革的新纪元串联起来的,从无声到有声,从黑白到彩色,从胶片到数字…… 但AI影像纪元的颠覆性在于,这不仅是一次工

今日大家都在搜的词: