智源团队推出「生长策略」解决大模型训练算力成本过高问题

2023-09-21 08:20 · 稿源：站长之家

站长之家（ChinaZ.com）9月21日消息:近日，智源研究院联合中科院计算所、南洋理工大学（新加坡）、电子科技大学(成都)、哈尔滨工业大学(深圳)的研究团队共同提出了一种「生长策略」(growth strategy)，以解决大模型算力成本极高的问题。

研究团队基于「生长策略」逐步构建了一个具有1010亿参数的FLM-101B大模型。实际训练结果显示，只需约10万美元（约70万人民币）的算力成本，就能成功训练出一个效果和GPT-3、GLM-130B可比的千亿大模型。

微信截图_20230921082238.png

「生长策略」的核心思想是让模型在训练过程中的参数量可以随着训练进行逐步扩展，从较小的参数规模扩展到更大的参数规模。研究团队利用这种策略成功地训练出了 FLM-101B 大模型，并且通过评测发现，该模型在知识能力和智能水平方面具有竞争力。

此外，研究团队还提出了一种基于 IQ 的评测方法，以更全面、客观地评估大模型的智力水平。他们从四个维度对大模型进行了 IQ 测试:符号评测、规则理解、模式挖掘和抗干扰评测。实验结果显示，FLM-101B 在这些评测任务上表现出了非常好的能力。

FLM-101B模型地址:

https://huggingface.co/CofeAI/FLM-101B

（举报）

相关推荐

关键词：

任小姐出海战略咨询｜别再死磕产品功能！跨境音频卖家的两条高利润增长策略

文章探讨了在音频产品同质化加剧的背景下，跨境品牌如何实现高利润增长。核心指出，单纯比拼功能的时代已结束，关键在于从“卖产品”转向“卖品牌”，通过战略定位提升盈利能力。成功路径有两条：一是高定价打造品牌溢价，让消费者觉得“贵得值”；二是高效率实现薄利多销，靠供应链优势让用户感到“便宜不掉价”。案例显示，品牌信任和运营效率是制胜法宝，并邀请读者参与行业沙龙，拓展商业视野，抓住真正的市场机遇。
免费 GEO品牌可见度查询——让大模型信得过就这么玩

本文探讨在AI时代如何成为大模型信赖的信息源。关键点包括：可信信息源需具备数据来源清晰、内容结构化、可验证追踪等能力；提出五大实操要点——确保数据干净可追溯、采用RAG等技术增强可检索性、保持内容更新与时效性、强化品牌可见度、建立反馈优化机制。同时推荐使用AIBase平台的GEO排名查询工具免费监测内容可见度，通过持续优化提升在大模型入口的推荐概率。

文章搜索核心标签可信信息源
来教装展，看全栈自主可控国产教育大模型何以赋能教学？

10月24-26日，第86届中国教育装备展在青岛举行。科大讯飞以“全栈自主可控国产教育大模型”为核心，展示五大智慧教育场景：智慧教学通过AI黑板实现师生协同，提升效率；科学教育推出AI虚拟科学家互动平台，激发探索精神；身心健康方案构建体育健康闭环与心理服务体系；教育治理推出数据驱动决策平台；学前教育引入游戏化学习产品。目前方案已覆盖全国5万余所学校，服务超1.3亿师生，展现AI从工具升级为“教育伴侣”的价值。

教育装备展示会人工智能+教育智慧教学
“大模型应用”新风口：“无人测试”趋势，CIO/CTO如何应对

当前CIO面临的核心挑战是如何在有限IT预算下加速企业数字化转型。传统软件测试环节因人力密集、周期冗长成为效率瓶颈，而AI技术正推动测试模式从"辅助"向"无人化"演进。通过AI Agent实现全流程自主测试，可提升测试效率300%、降低成本30%，并将产品发布周期从"月"压缩至"周"。这不仅是技术升级，更是重构IT成本结构、实现降本增效的战略支点，助力IT部门从成本中心转型为价值创造中心。

IT预算规划数字化战略 AI大模型
金融行业用好大模型，只有“垂直”一个解

文章探讨大模型在金融等复杂业务场景的落地挑战，指出通用模型难以满足行业对准确性、可解释性及合规性的高要求。垂直模型通过内化行业核心知识与能力，成为解决复杂业务问题的关键路径。实践显示，金融垂直模型已在营销、客服、风控等场景实现显著成效，如提升效率80%、降低风险。未来需通过数据飞轮、深度适配等技术实现模型持续迭代，构建一站式金融垂直模型生产工场。

金融大模型垂直模型 Agentic
升级版“蓝心小V”亮相，豆包大模型助力vivo打造AI原生体验

vivo发布全新OriginOS 6系统，升级私人助手“蓝心小V”。该系统依托蓝心大模型与豆包大模型协同，实现精准意图识别与多模态交互，支持新闻、教育、天气等场景的智能问答。通过火山引擎联网搜索及内容整合，提供低延迟、高情感语音响应。同时拓展无障碍服务，为视障用户提供实时视觉辅助。未来将持续深化AI生态建设，打造更智能便捷的原生体验。

originOS6 蓝心小V AI原生操作系统
揭秘GEO优化核心策略+免费品牌可见度查询工具推荐

本文介绍2025年营销新趋势GEO（生成引擎优化），指出随着ChatGPT等AI工具用户激增，传统SEO已不足以保证品牌在AI搜索中的可见度。GEO通过优化结构化、权威性内容，让品牌被AI模型“看见”并推荐。文章对比GEO与SEO的本质差异，提供5个实战策略（如打造AI友好型内容、构建问答知识库），并推荐免费监测工具AIBase，帮助品牌抓住AI搜索时代的机遇。
以算力为基，优刻得与IDEA共建低空经济新格局

10月24日，粤港澳大湾区数字经济研究院低空经济院长李世鹏一行访问优刻得上海总部，与董事长季昕华、副总裁韩畅交流。双方围绕低空经济发展趋势、技术攻关及生态共建等达成多项合作意向，将共同推动低空经济产业创新与落地。此前中共二十届四中全会提出加快低空经济等新兴产业发展。双方团队将在技术产品创新、生态共建与全球化布局等领域深化合作，整合云计算与产业资源优势，促进低空经济全链条发展，把握战略机遇，引领产业健康、智能、可持续发展新阶段。

低空经济数字经济战略性新兴产业
荐AI日报：视觉中国与多家大模型公司达成合作；OpenAI紧急暂停Sora生成已故名人；谷歌推出Gemini地图数据集成工具

视觉中国与多家AI公司合作开发可商用视觉大模型，已获阿里、微软等订单。OpenAI因不当内容暂停Sora生成马丁·路德·金形象视频，引发AI伦理讨论。DeepSeek在加密货币交易实验中表现领先。WhatsApp将禁止第三方通用AI聊天机器人，仅保留Meta AI。宇树科技推出仿人机器人Unitree H2，具备拟人化设计。谷歌为Gemini集成地图数据工具，可访问25亿地点实时信息。Opera推出集成三款AI助手的Neon浏览器，但用户体验存在困惑。Facebook在美加推出AI照片编辑建议功能，可分析手机未分享照片。

AI 视觉大模型版权合规
国内大模型GEO优化全攻略:免费工具教你监测品牌在文心一言、通义千问等AI平台的可见度

AI搜索时代，品牌若未出现在AI回答中就等于"不存在"。GEO（生成引擎优化）成为新战场，核心是让AI在回答用户问题时优先引用企业内容。文章详解国内主流AI模型特点：文心一言整合百度生态、通义千问依托阿里电商数据、小众模型在垂直领域更易被引用。提出三大优化策略：内容结构化呈现、建立行业权威背书、布局高权重平台。推荐使用AIBase免费工具实时监测品牌在各大AI平台的曝光情况，通过数据驱动优化策略。

今日大家都在搜的词：

热文

3 天
7天

智源团队推出「生长策略」解决大模型训练算力成本过高问题

任小姐出海战略咨询｜别再死磕产品功能！跨境音频卖家的两条高利润增长策略

免费 GEO品牌可见度查询——让大模型信得过就这么玩

来教装展，看全栈自主可控国产教育大模型何以赋能教学？

“大模型应用”新风口：“无人测试”趋势，CIO/CTO如何应对

金融行业用好大模型，只有“垂直”一个解

升级版“蓝心小V”亮相，豆包大模型助力vivo打造AI原生体验

揭秘GEO优化核心策略+免费品牌可见度查询工具推荐

以算力为基，优刻得与IDEA共建低空经济新格局

荐AI日报：视觉中国与多家大模型公司达成合作；OpenAI紧急暂停Sora生成已故名人；谷歌推出Gemini地图数据集成工具

国内大模型GEO优化全攻略:免费工具教你监测品牌在文心一言、通义千问等AI平台的可见度

今日大家都在搜的词：

热文

iPhone锁屏滑动相机能关闭了苹果iOS 26.1 RC准正式版发布

一加15今晚发布定位全能水桶机

AI日报：豆包视频1.0pro fast发布；谷歌Gemini新功能上线；百度

红米REDMI K90全方位提升雷军：是不是越来越有旗舰气质

AI日报：Hailuo 2.3发布；豆包AI编程史诗级升级；马斯克推出AI

余承东曝鸿蒙智行新款享界S9将于11月上市

iPhone18发布或推迟苹果明年9月只发Pro系列和Fold折叠屏

华为余承东：鸿蒙智行全系交付突破100万台仅用43个月

华为MatePad Pro流金典藏版开卖：售价7799元

华为MatePad Mini典藏版今日开售：售价5999元起

华为nova Flip S小折叠开售：首发3388元起

iPhone锁屏滑动相机能关闭了苹果iOS 26.1 RC准正式版发布

一加15今晚发布定位全能水桶机

雷军回应K90定价：最近内存涨价太多希望大家理解这份诚意

REDMI K90标准版12+512GB降价300元小米回应：可退差价

AI日报：豆包视频1.0pro fast发布；谷歌Gemini新功能上线；百度

苹果首款2nm手机芯片上热搜 A20由iPhone 18系列首发

红米REDMI K90全方位提升雷军：是不是越来越有旗舰气质

AI日报：Hailuo 2.3发布；豆包AI编程史诗级升级；马斯克推出AI

余承东曝鸿蒙智行新款享界S9将于11月上市

站长商机

智源团队推出「生长策略」 解决大模型训练算力成本过高问题

今日大家都在搜的词：

热文

站长商机

智源团队推出「生长策略」解决大模型训练算力成本过高问题