为什么缩小大语言模型是生成式人工智能的未来？

2023-08-15 14:30 · 稿源：站长之家

本文概要:

1. 大型语言模型（LLM）在企业使用中存在明显挑战，而较小的语言模型则可以更好地适应企业需求。

2. 较小的语言模型可以在现有的安全环境中进行操作和训练，速度更快、准确性更高。

3. 较小的语言模型可以基于企业的敏感数据进行定制，与其他数据集结合使用，为企业提供更有价值的洞察力。

站长之家(ChinaZ.com) 8月15日消息:很多企业热衷于接入生成式人工智能，但像 ChatGPT 这样的大型语言模型给企业使用带来了明显的挑战。本月的一项研究发现，75% 的组织正在考虑或已经实施生成式人工智能应用的禁令，理由是安全、隐私和其他问题。训练大语言模型的高昂成本也被视为采用的重大障碍。

机器人写作AI写作AI记者

据报道，像 ChatGPT 这样的法学硕士接受了超过1000亿个“参数”或决定模型行为的值的训练。这使得它们的建造和运营成本极其昂贵——训练 ChatGPT的估计成本为400万美元。

为了从生成式人工智能中获得价值，未来的发展方向在于更小的语言模型，它们仅需要更少的时间和资源来维护，并且可以在企业的安全云环境中进行操作。较小的语言模型可以针对更窄的任务集进行优化，从而实现更快速和更准确的结果。

与公共 LLM 不同，较小的语言模型可以通过训练企业最敏感的数据进行定制，而无需将数据输入到公共 LLM 中，因此安全和隐私风险较低。这些较小的模型还可以结合第三方数据源，如经济数据、商品价格、天气等，为企业提供更全面的洞察力。

未来，可能会出现只有少数几个被广泛使用的基础 LLM，由 Meta、Google 和百度等技术巨头运营。较小的语言模型有着广阔的应用前景，可以在公司或部门级别提供有价值的洞察力，是释放生成式人工智能真正力量的关键。

（举报）

相关推荐

关键词：

LLM
AI头条

强强联手！深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码

2025年9月29日，深度求索公司发布新一代模型架构DeepSeek-V3.2，引发行业关注。寒武纪同步宣布适配该模型并开源vLLM-MLU推理引擎代码。新发布的DeepSeek-V3.2-Exp是实验性版本，在V3.1-Terminus基础上引入稀疏注意力机制，优化长文本训练和推理效率。目前官方应用端已同步更新，API大幅降价。此次模型体积达671GB，下载需8-10小时。业内专家指出，此次快速适配表明双方早有深度技术协�

DeepSeek-V3.2 大模型架构稀疏注意力机制
荐AI为他们圆了导演梦

“我们这么小团队做的‘小东西’真的可以吗?” 当得知自己作品《小怪物》入围釜山电影节时，黎晓薇的第一反应是“难以置信”，因为就在几个月前她才开始正式接触AI工具。和黎晓薇一样幸运的，还有徐文君、小文和MANYMANY团队，这些来自中国的AI创作者们分别带来了《一目五先生》《权利童话》和《九宵》三部作品。 “未来影像计划”由即梦AI联合火山引擎、上海电�

AI生成影像釜山电影节未来影像计划
荐“老登”应用，霸榜AI

AI应用的争夺战，打到哪儿了? 如果把整个AI行业想象成一座金矿:基础设施层（芯片、算力）相当于“卖铲子”，提供挖矿的基础工具;模型层(大模型研发)好比“卖地图”，告诉大家哪里有金子;而应用层是直接“下场淘金”，把金子变现。近两年AI应用的使用者越来越多，QuestMobile数据显示，截止到2025年8月，移动端AI应用用户规模达6.45亿，PC端达2.04亿。其中原生APP亿级应用的

AI应用 AI原生应用 AI行业
云栖大会上，感受AI汽车的“乐与路”

文章聚焦云栖大会汽车峰会，探讨AI如何重塑汽车产业。核心观点指出：汽车正成为数字AI与物理AI的融合平台，其中VLA（视觉-语言-行动）架构是实现智能驾驶从"功能定义"向"能力涌现"跃升的关键。阿里云通过提供万卡级AI算力集群、通义大模型等技术基础设施，支撑中国车企智能化转型和出海布局。数据显示，超60%中国智能辅助驾驶的AI算力来自阿里云，95%出海车企选择其服务。文章强调，汽车产业正在经历从技术架构到生态合作的全方位重构。

大模型物理AI 汽车产业
全球首个！OpenAI将推“AI版抖音”：禁止上传实拍内容视频100%由AI生成

国庆假期前夕，OpenAI发布了Sora 2，一款旗舰视频和音频生成模型。据介绍，Sora 2可以完成以前的视频生成模型难以完成的事情，比如运动员的奥林匹克体动作、桨板上的后空翻，准确模拟浮力和刚度的动态等等，并擅长现实主义、电影和动漫风格。一则来自《连线》杂志的重磅爆料更是指出，OpenAI的下一步棋，并非简单升级一个模型，而是要亲自下场，推出一个独立的AI影�

OpenAI Sora 2
千亿AI玩具市场：当IP被AI“唤醒”，玩具厂商如何开辟新赛道？

过去两年AI技术热度飙升，从ChatGPT爆发到谷歌、Meta频发新一代大模型，AI已切实改变生活方式。传统玩具行业正孕育智能化尝试，迪士尼与乐森机器人合作推出Mini Robot智能潮玩，通过“通用底座+可替换IP公仔”平台化设计，结合机器人技术与情感交互，打破单一产品逻辑。该产品支持动作编程、语音定制及UGC内容共享，推动玩具从“产品消费”转向“情绪消费”，成为连接虚拟与现实的新型生命体。

AI技术智能化传统玩具行业
远东股份：ALL IN“电能+算力+AI”，智能驱动未来

远东股份（600869）凭借“电能+算力+AI”战略，在能源与算力融合领域形成先发优势。公司深耕特高压输电、新能源等关键技术，自主研发高导铝绞线提升输电效率，产品应用于多条国家级特高压线路。同时布局液冷技术研发，为数据中心提供高效散热方案。未来将持续推进“AI+能源”产业生态建设，助力制造业智能化升级和绿色高效算能模式构建。

人工智能能源算力
荐淘宝用AI给电商搜索趟了条新路

众所周知，最近两个月，淘宝搜索的AI化有了明显的提速趋势。 8月，淘宝低调全量上线了“AI万能搜”产品;9月，淘宝“AI助手”传出内测消息、拍立淘的“AI找低价”也全量上线。这三个产品分别覆盖了传统搜索入口，图片搜索入口、以及搜索页面呈现后的交互，算是在淘宝端内形成了一个围绕搜索场景的能力矩阵。前段时间，硅星人也拿到了“AI助手”的内测资格，我

AI万能搜淘宝搜索AI化 AI助手内测
从数字工具到效率员工，AI员工赋能企业营销服务生产力全面提升！多款AI工具口碑推荐，用AI驱动新增长！

如今，AI赋能业务已非遥不可及，而是切实帮助企业降本增效的新方案。文章以获客、销售、服务、办公四大场景为例，说明AI如何替代重复性工作：营销人员可借助AI工具快速生成高质量素材；销售可将客户跟进、资料更新等琐事交给AI，专注高价值沟通；售后AI能24小时响应基础问题，提升服务效率；办公场景中，AI还能辅助招聘筛选、邮件撰写等日常任务。通过引入具备理解、推理、执行能力的智能工具，企业能以更少人力、更高效率实现业务优化，未来率先布局AI的企业将更具竞争优势。

AI赋能业务 AI工具业务效率
华为AI城市峰会：共建城市数智底座，AI CITY先锋城市案例发布

9月18日，华为全联接大会2025期间举办AI城市峰会，聚焦智慧城市治理、政务服务与产业升级。华为发布“AI CITY 1234MNX”参考架构，通过智能云底座、安全保障体系及统一平台，推动城市全域智能化转型。会议分享了深圳、广州等地的实践案例，展示AI在政务、城市管理及工业领域的应用成效，并呼吁各方共建AI城市生态，加速数字化进程。

AI城市智慧政务产业数智升级

今日大家都在搜的词：

热文

3 天
7天

为什么缩小大语言模型是生成式人工智能的未来？

强强联手！深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码

荐AI为他们圆了导演梦

荐“老登”应用，霸榜AI

云栖大会上，感受AI汽车的“乐与路”

全球首个！OpenAI将推“AI版抖音”：禁止上传实拍内容视频100%由AI生成

千亿AI玩具市场：当IP被AI“唤醒”，玩具厂商如何开辟新赛道？

远东股份：ALL IN“电能+算力+AI”，智能驱动未来

荐淘宝用AI给电商搜索趟了条新路

从数字工具到效率员工，AI员工赋能企业营销服务生产力全面提升！多款AI工具口碑推荐，用AI驱动新增长！

华为AI城市峰会：共建城市数智底座，AI CITY先锋城市案例发布

今日大家都在搜的词：

热文

微信又更新了撤回消息有大变化：可撤回本次发送的全部消息

雷军：小米17系列首销权益延续至10月31日

AI日报：Veo 3.1可生成1分钟视频；蚂蚁发布万亿参数语言模型 L

三星W26折叠屏手机官宣10月11日发布

iQOO 15官宣：10月20日发布

新款智界R7/S7上市44天大定破38000台

京东双11今晚开启：现货开卖官方直降低至一折

荣耀Magic8系列暨MagicOS10发布会定档10月15日

真我官宣与理光达成影像战略合作：真我GT8 Pro首发搭载

iQOO 15搭载自研电竞芯片Q3 能效提升40%

微信又更新了撤回消息有大变化：可撤回本次发送的全部消息

比特币价格突破12.5万美元刷新历史最高纪录

雷军：小米17系列首销权益延续至10月31日

雷军：小米17系列开售仅5天销量破100万台

小米 17 标准版1TB版本 5299 元开售全系列销量同比增超20%

腾讯混元图像3.0登顶LMArena榜一

乔布斯逝世14周年库克发文缅怀：我们深切怀念你

AI日报：Veo 3.1可生成1分钟视频；蚂蚁发布万亿参数语言模型 L

三星W26折叠屏手机官宣10月11日发布

iQOO 15官宣：10月20日发布

站长商机