首页 > 业界 > 关键词  > LLM最新资讯  > 正文

为什么缩小大语言模型是生成式人工智能的未来?

2023-08-15 14:30 · 稿源:站长之家

本文概要:

1. 大型语言模型(LLM)在企业使用中存在明显挑战,而较小的语言模型则可以更好地适应企业需求。

2. 较小的语言模型可以在现有的安全环境中进行操作和训练,速度更快、准确性更高。

3. 较小的语言模型可以基于企业的敏感数据进行定制,与其他数据集结合使用,为企业提供更有价值的洞察力。

站长之家(ChinaZ.com) 8月15日 消息:很多企业热衷于接入生成式人工智能,但像 ChatGPT 这样的大型语言模型 给企业使用带来了明显的挑战。本月的一项 研究 发现,75% 的组织正在考虑或已经实施生成式人工智能应用的禁令,理由是安全、隐私和其他问题。训练大语言模型的高昂成本也 被视为采用的重大障碍。

机器人写作AI写作AI记者

据报道,像 ChatGPT 这样的法学硕士 接受了超过1000亿个“参数”或决定模型行为的值的训练。这使得它们的建造和运营成本极其昂贵——训练 ChatGPT的估计成本 为400万美元。

为了从生成式人工智能中获得价值,未来的发展方向在于更小的语言模型,它们仅需要更少的时间和资源来维护,并且可以在企业的安全云环境中进行操作。较小的语言模型可以针对更窄的任务集进行优化,从而实现更快速和更准确的结果。

与公共 LLM 不同,较小的语言模型可以通过训练企业最敏感的数据进行定制,而无需将数据输入到公共 LLM 中,因此安全和隐私风险较低。这些较小的模型还可以结合第三方数据源,如经济数据、商品价格、天气等,为企业提供更全面的洞察力。

未来,可能会出现只有少数几个被广泛使用的基础 LLM,由 Meta、Google 和百度等技术巨头运营。较小的语言模型有着广阔的应用前景,可以在公司或部门级别提供有价值的洞察力,是释放生成式人工智能真正力量的关键。

举报

  • 相关推荐
  • 强强联手!深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码

    2025年9月29日,深度求索公司发布新一代模型架构DeepSeek-V3.2,引发行业关注。寒武纪同步宣布适配该模型并开源vLLM-MLU推理引擎代码。新发布的DeepSeek-V3.2-Exp是实验性版本,在V3.1-Terminus基础上引入稀疏注意力机制,优化长文本训练和推理效率。目前官方应用端已同步更新,API大幅降价。此次模型体积达671GB,下载需8-10小时。业内专家指出,此次快速适配表明双方早有深度技术协�

  • AI为他们圆了导演梦

    “我们这么小团队做的‘小东西’真的可以吗?” 当得知自己作品《小怪物》入围釜山电影节时,黎晓薇的第一反应是“难以置信”,因为就在几个月前她才开始正式接触AI工具。 和黎晓薇一样幸运的,还有徐文君、小文和MANYMANY团队,这些来自中国的AI创作者们分别带来了《一目五先生》《权利童话》和《九宵》三部作品。 “未来影像计划”由即梦AI联合火山引擎、上海电�

  • “老登”应用,霸榜AI

    AI应用的争夺战,打到哪儿了? 如果把整个AI行业想象成一座金矿:基础设施层(芯片、算力)相当于“卖铲子”,提供挖矿的基础工具;模型层(大模型研发)好比“卖地图”,告诉大家哪里有金子;而应用层是直接“下场淘金”,把金子变现。 近两年AI应用的使用者越来越多,QuestMobile数据显示,截止到2025年8月,移动端AI应用用户规模达6.45亿,PC端达2.04亿。其中原生APP亿级应用的

  • 云栖大会上,感受AI汽车的“乐与路”

    文章聚焦云栖大会汽车峰会,探讨AI如何重塑汽车产业。核心观点指出:汽车正成为数字AI与物理AI的融合平台,其中VLA(视觉-语言-行动)架构是实现智能驾驶从"功能定义"向"能力涌现"跃升的关键。阿里云通过提供万卡级AI算力集群、通义大模型等技术基础设施,支撑中国车企智能化转型和出海布局。数据显示,超60%中国智能辅助驾驶的AI算力来自阿里云,95%出海车企选择其服务。文章强调,汽车产业正在经历从技术架构到生态合作的全方位重构。

  • 全球首个!OpenAI将推“AI版抖音”:禁止上传实拍内容 视频100%由AI生成

    国庆假期前夕,OpenAI发布了Sora 2,一款旗舰视频和音频生成模型。 据介绍,Sora 2可以完成以前的视频生成模型难以完成的事情,比如运动员的奥林匹克体动作、桨板上的后空翻,准确模拟浮力和刚度的动态等等,并擅长现实主义、电影和动漫风格。 一则来自《连线》杂志的重磅爆料更是指出,OpenAI的下一步棋,并非简单升级一个模型,而是要亲自下场,推出一个独立的AI影�

  • 千亿AI玩具市场:当IP被AI“唤醒”,玩具厂商如何开辟新赛道?

    过去两年AI技术热度飙升,从ChatGPT爆发到谷歌、Meta频发新一代大模型,AI已切实改变生活方式。传统玩具行业正孕育智能化尝试,迪士尼与乐森机器人合作推出Mini Robot智能潮玩,通过“通用底座+可替换IP公仔”平台化设计,结合机器人技术与情感交互,打破单一产品逻辑。该产品支持动作编程、语音定制及UGC内容共享,推动玩具从“产品消费”转向“情绪消费”,成为连接虚拟与现实的新型生命体。

  • 远东股份:ALL IN“电能+算力+AI”,智能驱动未来

    远东股份(600869)凭借“电能+算力+AI”战略,在能源与算力融合领域形成先发优势。公司深耕特高压输电、新能源等关键技术,自主研发高导铝绞线提升输电效率,产品应用于多条国家级特高压线路。同时布局液冷技术研发,为数据中心提供高效散热方案。未来将持续推进“AI+能源”产业生态建设,助力制造业智能化升级和绿色高效算能模式构建。

  • 淘宝用AI给电商搜索趟了条新路

    ​众所周知 ,最近两个月,淘宝搜索的AI化有了明显的提速趋势。 8月,淘宝低调全量上线了“AI万能搜”产品;9月,淘宝“AI助手”传出内测消息、拍立淘的“AI找低价”也全量上线。 这三个产品分别覆盖了传统搜索入口,图片搜索入口、以及搜索页面呈现后的交互,算是在淘宝端内形成了一个围绕搜索场景的能力矩阵。 前段时间,硅星人也拿到了“AI助手”的内测资格,我

  • 从数字工具到效率员工,AI员工赋能企业营销服务生产力全面提升!多款AI工具口碑推荐,用AI驱动新增长!

    如今,AI赋能业务已非遥不可及,而是切实帮助企业降本增效的新方案。文章以获客、销售、服务、办公四大场景为例,说明AI如何替代重复性工作:营销人员可借助AI工具快速生成高质量素材;销售可将客户跟进、资料更新等琐事交给AI,专注高价值沟通;售后AI能24小时响应基础问题,提升服务效率;办公场景中,AI还能辅助招聘筛选、邮件撰写等日常任务。通过引入具备理解、推理、执行能力的智能工具,企业能以更少人力、更高效率实现业务优化,未来率先布局AI的企业将更具竞争优势。

  • 华为AI城市峰会:共建城市数智底座,AI CITY先锋城市案例发布

    9月18日,华为全联接大会2025期间举办AI城市峰会,聚焦智慧城市治理、政务服务与产业升级。华为发布“AI CITY 1234MNX”参考架构,通过智能云底座、安全保障体系及统一平台,推动城市全域智能化转型。会议分享了深圳、广州等地的实践案例,展示AI在政务、城市管理及工业领域的应用成效,并呼吁各方共建AI城市生态,加速数字化进程。

今日大家都在搜的词: