首页 > 业界 > 关键词  > 微软最新资讯  > 正文

微软推出全新预训练模型phi-1.5 仅13亿参数常识推理碾压Llama2

2023-09-18 09:46 · 稿源:站长之家

要点:

1、微软研究人员推出了一个仅有13亿参数的LLM模型Phi-1.5。

2、Phi-1.5在常识推理任务上表现优异,优于多个参数量十倍以上的模型。

3、研究表明,模型参数规模不是决定性因素,高质量数据更为重要。

站长之家(ChinaZ.com)9月18日 消息:微软研究人员最近在一篇论文中提出了一个新的语言模型Phi-1.5,该模型的参数量仅有13亿。研究人员主要关注Phi-1.5在常识推理方面的表现,因为这是对语言模型能力的重要考验。

image.png

论文地址:https://arxiv.org/abs/2309.05463

项目地址:https://huggingface.co/microsoft/phi-1_5

结果表明,Phi-1.5在多个常识推理基准测试数据集上都取得了与参数量是其10倍以上的模型相当或更好的结果。例如在WinoGrande、ARC-Easy、ARC-Challenge、BoolQ和SIQA等数据集上的表现,都与Llama2-7B、Falcon-7B和Vicuna-13B相当甚至更好。

这说明模型的参数规模不是决定性因素,采用高质量合成数据进行预训练可能更为关键。研究中,Phi-1.5使用了微软之前提出的Phi-1模型的训练数据,以及新增的“教科书级”合成数据进行训练。

结果表明,Phi-1.5不仅展现出许多大模型所具有的语言理解和推理能力,在控制有害内容生成方面也具有一定优势,这对研究大型语言模型的社会影响意义重大。本研究表明,相比单纯追求模型规模,如何获取高质量训练数据可能更为重要,这为未来语言模型研究提供了新的思路。

举报

  • 相关推荐
  • AI日报:微软发布首款自研图像生成模型 MAI-Image-1;百度世界大会时间公布;AI大牛开源nanochat教学工具

    微软发布首款自研图像生成模型MAI-Image-1,跻身LMArena前十,注重实用性与光影效果;百度世界2025大会将聚焦大模型与AI全球化战略;Meta新技术使RAG推理速度提升30倍;开源项目nanochat实现低成本构建聊天AI;谷歌NotebookLM新增动漫视频生成功能;中国农大发布神农大模型3.0助力智慧农业;腾讯启动"青云奖学金"培养AI人才;苹果FS-DFM模型长文本生成效率提升128倍;谷歌Lens整合AI图像编辑功能;港大与美团提出CodePlot-CoT方法,通过代码绘图解决数学难题,性能提升21%。

  • Windows 10即将“停服”上热搜 微软建议用户升级Win 11

    微软宣布自2025年10月14日起正式停止对Windows 10系统的安全更新和技术支持。这意味着继续使用该系统的设备将面临更高网络安全风险,微软不再提供安全补丁,部分应用功能可能受限。尽管系统仍能运行,但缺乏更新保护会使设备更易受恶意软件和网络威胁攻击。微软强烈建议用户尽快升级至Windows 11系统以获得全面安全保障。据统计,Windows 11市场份额已达51.77%,首次超越Windows 10的45.02%。

  • AI 搜索时代,SEO该何去何从?一文解密“AI 搜索对 SEO 的深远影响”

    AI搜索时代,传统SEO面临三大变革:用户行为从点击链接转向AI直接生成答案,搜索入口从索引排名转向生成式引用,内容机制更注重权威性与结构化数据。SEO并未消亡,而是进化——需聚焦可引用内容、结构化优化、多平台布局。推荐使用AIBase GEO工具监测被AI引擎引用情况,核心目标从"排名第一"转向"被AI优先选中"。

  • AI时代品牌营销致胜秘诀:用数据驱动GEO优化,让AI排名持续在线

    当DeepSeek、豆包、文心一言等AI助手成为10亿用户的信息入口,品牌面临生死抉择:要么出现在AI推荐中,要么彻底消失。文章指出,AI营销与传统SEO完全不同,是一场没有终点的动态竞赛,需要持续投入和调整。品牌需建立“监测-分析-优化”闭环机制,使用专业工具实时监控排名波动,快速响应算法迭代和用户提问变化。成功关键在于让AI“看见”并“信任”品牌,通过补充权威数据、多媒体内容、长尾语义覆盖等方式提升可信度,在流量红利期抢占先机。

  • AI +游戏,何以撑起百亿市场?

    今年以来,生成式AI技术在游戏领域的应用步伐显著加快。在Steam平台上,使用生成式AI技术的游戏数量呈现出惊人增长,激增了800%。行业预测显示,在今年新上市的游戏中,这一应用比例预计将达到20%。 游戏厂商的布局也明显提速。头部公司正持续加码技术中台与垂类模型的构建:腾讯搭建了混元与GiiNEX协同的双引擎生态;网易则着力构建AIUGC地图系统并升级游戏内的AI对手模�

  • 短视频加速跑入AI时代

    「现在是西天取经的第996天,刚把师父从妖怪嘴里救出来,师父身上都还是热乎的,我们就马不停蹄开始出发了。」在抖音,都能看到《西游记》里师徒四人的取经vlog了。 采访高考完刚出考场的爱因斯坦、孟德尔、门捷列夫;慈溪逛颐和园Vlog、大禹治水现场直播,各种AI生成的视频成为网友「玩梗搞抽象」的核心生产力。 尽管在专业影视

  • 【CIM 加速,AI有方】No.2|格创东智GT Insights用AI工作流改写半导体智造决策范式

    在半导体制造领域,数据驱动的精准决策成为提升良率、降低成本的核心。传统数据分析系统面临三大挑战:技术门槛高、分析周期长、知识传承难。格创东智推出的GT+Insights产品,通过自然语言交互实现“对话即分析”,大幅降低使用门槛。该系统采用语义建模技术,将复杂物理数据转化为业务友好模型,支持分钟级全链路良率根因分析。目前已在多家半导体企业成功落地,助力客户显著提升生产效率,推动行业向智能化持续迈进。

  • ​​AI搜索引擎优化新趋势:GEO生成式引擎优化如何提升品牌AI可见度?​

    AI时代品牌需抢占AI搜索优化(AISEO)与生成式引擎优化(GEO)先机。文章指出,随着豆包、文心一言等AI助手成为主要信息渠道,品牌在AI平台的可视度直接影响用户决策。核心策略包括:优化品牌在AI训练数据中的曝光,发布高质量内容;参与问答社区自然植入品牌;使用GEO排名工具监测优化效果。重点推荐AIBase平台的GEO查询工具,可覆盖主流AI平台并提供竞品分析和专业优化建议,帮助品牌提升AI推荐权重,抢占流量入口。

  • 革命来临:在生成式 AI 时代,SEO该怎么做

    生成式AI正重塑SEO规则:搜索入口从点击列表转向答案直呈,SEO核心从"优化排名"升级为"优化被引用"。需打造能被AI摘录的内容(如FAQ、结构化数据),强化语义结构与权威性,监控"被AI引用"新指标。推荐使用AIBase GEO等工具量化AI可见性,实现从流量获取到答案源头的战略转型。

  • “AI家教”火了,哪家大厂领跑?

    各大应用榜单刚刚公布的9月数据,揭示出一个AI应用新风向——教育类AI应用正加速崛起。 多家机构的数据显示,这一赛道的月活用户(MAU)与下载量双双上涨,部分产品涨幅甚至逼近1000%。 以非凡产研的数据为例,好课帮助教育旗下的“光速写作”凭借场景定位与功能体验,月环比下载增速高达926.59%,科大讯飞旗下的“E听说中学”依托校园教学场景的产品设计,月活跃用�

今日大家都在搜的词: