微软推出全新预训练模型phi-1.5 仅13亿参数常识推理碾压Llama2

2023-09-18 09:46 · 稿源：站长之家

要点:
1、微软研究人员推出了一个仅有13亿参数的LLM模型Phi-1.5。
2、Phi-1.5在常识推理任务上表现优异，优于多个参数量十倍以上的模型。
3、研究表明，模型参数规模不是决定性因素，高质量数据更为重要。

站长之家（ChinaZ.com）9月18日消息:微软研究人员最近在一篇论文中提出了一个新的语言模型Phi-1.5，该模型的参数量仅有13亿。研究人员主要关注Phi-1.5在常识推理方面的表现，因为这是对语言模型能力的重要考验。

论文地址:https://arxiv.org/abs/2309.05463

项目地址:https://huggingface.co/microsoft/phi-1_5

结果表明，Phi-1.5在多个常识推理基准测试数据集上都取得了与参数量是其10倍以上的模型相当或更好的结果。例如在WinoGrande、ARC-Easy、ARC-Challenge、BoolQ和SIQA等数据集上的表现，都与Llama2-7B、Falcon-7B和Vicuna-13B相当甚至更好。

这说明模型的参数规模不是决定性因素，采用高质量合成数据进行预训练可能更为关键。研究中，Phi-1.5使用了微软之前提出的Phi-1模型的训练数据，以及新增的“教科书级”合成数据进行训练。

结果表明，Phi-1.5不仅展现出许多大模型所具有的语言理解和推理能力，在控制有害内容生成方面也具有一定优势，这对研究大型语言模型的社会影响意义重大。本研究表明，相比单纯追求模型规模，如何获取高质量训练数据可能更为重要，这为未来语言模型研究提供了新的思路。

（举报）

相关推荐

关键词：

AI日报：微软发布首款自研图像生成模型 MAI-Image-1；百度世界大会时间公布；AI大牛开源nanochat教学工具

微软发布首款自研图像生成模型MAI-Image-1，跻身LMArena前十，注重实用性与光影效果；百度世界2025大会将聚焦大模型与AI全球化战略；Meta新技术使RAG推理速度提升30倍；开源项目nanochat实现低成本构建聊天AI；谷歌NotebookLM新增动漫视频生成功能；中国农大发布神农大模型3.0助力智慧农业；腾讯启动"青云奖学金"培养AI人才；苹果FS-DFM模型长文本生成效率提升128倍；谷歌Lens整合AI图像编辑功能；港大与美团提出CodePlot-CoT方法，通过代码绘图解决数学难题，性能提升21%。

AI 图像生成微软
Windows 10即将“停服”上热搜微软建议用户升级Win 11

微软宣布自2025年10月14日起正式停止对Windows 10系统的安全更新和技术支持。这意味着继续使用该系统的设备将面临更高网络安全风险，微软不再提供安全补丁，部分应用功能可能受限。尽管系统仍能运行，但缺乏更新保护会使设备更易受恶意软件和网络威胁攻击。微软强烈建议用户尽快升级至Windows 11系统以获得全面安全保障。据统计，Windows 11市场份额已达51.77%，首次超越Windows 10的45.02%。

Windows10 微软系统升级
AI 搜索时代，SEO该何去何从?一文解密“AI 搜索对 SEO 的深远影响”

AI搜索时代，传统SEO面临三大变革：用户行为从点击链接转向AI直接生成答案，搜索入口从索引排名转向生成式引用，内容机制更注重权威性与结构化数据。SEO并未消亡，而是进化——需聚焦可引用内容、结构化优化、多平台布局。推荐使用AIBase GEO工具监测被AI引擎引用情况，核心目标从"排名第一"转向"被AI优先选中"。

AI搜索 SEO影响流量结构
AI时代品牌营销致胜秘诀：用数据驱动GEO优化，让AI排名持续在线

当DeepSeek、豆包、文心一言等AI助手成为10亿用户的信息入口，品牌面临生死抉择：要么出现在AI推荐中，要么彻底消失。文章指出，AI营销与传统SEO完全不同，是一场没有终点的动态竞赛，需要持续投入和调整。品牌需建立“监测-分析-优化”闭环机制，使用专业工具实时监控排名波动，快速响应算法迭代和用户提问变化。成功关键在于让AI“看见”并“信任”品牌，通过补充权威数据、多媒体内容、长尾语义覆盖等方式提升可信度，在流量红利期抢占先机。
荐AI +游戏，何以撑起百亿市场？

今年以来，生成式AI技术在游戏领域的应用步伐显著加快。在Steam平台上，使用生成式AI技术的游戏数量呈现出惊人增长，激增了800%。行业预测显示，在今年新上市的游戏中，这一应用比例预计将达到20%。游戏厂商的布局也明显提速。头部公司正持续加码技术中台与垂类模型的构建:腾讯搭建了混元与GiiNEX协同的双引擎生态;网易则着力构建AIUGC地图系统并升级游戏内的AI对手模�

生成式AI 游戏领域 Steam平台
短视频加速跑入AI时代

「现在是西天取经的第996天，刚把师父从妖怪嘴里救出来，师父身上都还是热乎的，我们就马不停蹄开始出发了。」在抖音，都能看到《西游记》里师徒四人的取经vlog了。采访高考完刚出考场的爱因斯坦、孟德尔、门捷列夫;慈溪逛颐和园Vlog、大禹治水现场直播，各种AI生成的视频成为网友「玩梗搞抽象」的核心生产力。尽管在专业影视

文章搜索核心标签 AI生成
【CIM 加速，AI有方】No.2｜格创东智GT Insights用AI工作流改写半导体智造决策范式

在半导体制造领域，数据驱动的精准决策成为提升良率、降低成本的核心。传统数据分析系统面临三大挑战：技术门槛高、分析周期长、知识传承难。格创东智推出的GT+Insights产品，通过自然语言交互实现“对话即分析”，大幅降低使用门槛。该系统采用语义建模技术，将复杂物理数据转化为业务友好模型，支持分钟级全链路良率根因分析。目前已在多家半导体企业成功落地，助力客户显著提升生产效率，推动行业向智能化持续迈进。

半导体制造数据驱动精准决策
AI搜索引擎优化新趋势：GEO生成式引擎优化如何提升品牌AI可见度？

AI时代品牌需抢占AI搜索优化(AISEO)与生成式引擎优化(GEO)先机。文章指出，随着豆包、文心一言等AI助手成为主要信息渠道，品牌在AI平台的可视度直接影响用户决策。核心策略包括：优化品牌在AI训练数据中的曝光，发布高质量内容；参与问答社区自然植入品牌；使用GEO排名工具监测优化效果。重点推荐AIBase平台的GEO查询工具，可覆盖主流AI平台并提供竞品分析和专业优化建议，帮助品牌提升AI推荐权重，抢占流量入口。

AISEO GEO AI搜索引擎优化
革命来临：在生成式 AI 时代，SEO该怎么做

生成式AI正重塑SEO规则：搜索入口从点击列表转向答案直呈，SEO核心从"优化排名"升级为"优化被引用"。需打造能被AI摘录的内容（如FAQ、结构化数据），强化语义结构与权威性，监控"被AI引用"新指标。推荐使用AIBase GEO等工具量化AI可见性，实现从流量获取到答案源头的战略转型。

生成式AI SEO变革搜索入口
“AI家教”火了，哪家大厂领跑？

各大应用榜单刚刚公布的9月数据，揭示出一个AI应用新风向——教育类AI应用正加速崛起。多家机构的数据显示，这一赛道的月活用户（MAU）与下载量双双上涨，部分产品涨幅甚至逼近1000%。以非凡产研的数据为例，好课帮助教育旗下的“光速写作”凭借场景定位与功能体验，月环比下载增速高达926.59%，科大讯飞旗下的“E听说中学”依托校园教学场景的产品设计，月活跃用�

AI应用教育类AI 月活用户

今日大家都在搜的词：

热文

3 天
7天

微软推出全新预训练模型phi-1.5 仅13亿参数常识推理碾压Llama2

AI日报：微软发布首款自研图像生成模型 MAI-Image-1；百度世界大会时间公布；AI大牛开源nanochat教学工具

Windows 10即将“停服”上热搜微软建议用户升级Win 11

AI 搜索时代，SEO该何去何从?一文解密“AI 搜索对 SEO 的深远影响”

AI时代品牌营销致胜秘诀：用数据驱动GEO优化，让AI排名持续在线

荐AI +游戏，何以撑起百亿市场？

短视频加速跑入AI时代

【CIM 加速，AI有方】No.2｜格创东智GT Insights用AI工作流改写半导体智造决策范式

AI搜索引擎优化新趋势：GEO生成式引擎优化如何提升品牌AI可见度？

革命来临：在生成式 AI 时代，SEO该怎么做

“AI家教”火了，哪家大厂领跑？

今日大家都在搜的词：

热文

华为FreeClip 2耳夹耳机正式开售：售价1299元搭载NPU AI处理器

天猫双11今晚8点开卖品类券每人可领万元

REDMI K90 Pro Max本周四发布卢伟冰：给4K档一点小小的震撼

REDMI K90 Pro Max搭载小米17同款光影猎人950超大底主摄

AI日报：视觉中国与多家大模型公司达成合作；OpenAI紧急暂停So

火车免费坐？12306今起又上新功能：积分可兑换车票

苹果天猫双11今晚开卖 iPhone17pro天猫官旗首次降价

真我GT8官宣搭载Pro同款理光GR影像系统

REDMI K90 Pro Max搭载6.9英寸超级像素屏幕

红米REDMI K90 Pro Max官宣搭载7560mAh电池

AI日报：谷歌发布Veo 3.1；通义千问推Qwen Chat Memory功能；S

AI日报：谷歌Gemini 3.0 Pro小范围推送；爱诗科技完成1亿元B+轮

王腾首次回应下一步计划：称在考虑些创业项目

REDMI K90 Pro Max外观公布：后置BOSE认证扬声器

卢伟冰官宣REDMI K90系列下周发布：不排斥和小米竞争

苹果华为OPPO将推出eSIM手机 OPPO Find X9系列已确认将支持

微信回应出朋友圈访客功能：可能会让用户产生焦虑重申不会推出

红米REDMI K90 Pro Max丹宁色亮相采用第三代科纳皮设计

知乎崩了上热搜：网页端完全无法进入 App端也未能幸免

华为nova 14活力版、nova Flip S官宣明天发布

站长商机