三个臭皮匠顶个诸葛亮？可能是真的，已证实混合多个小模型性能比肩GPT3.5

2024-01-18 13:48 · 稿源：机器之心公众号

对模型参数量的迷信、执念也许可以放下了，混合多个小模型也是未来构造对话型 AI 的一个光明的方向。在对话型人工智能（AI）研究中，存在趋势即朝着开发参数更多的模型方向发展，如 ChatGPT 等为代表的模型。尽管这些庞大的模型能够生成越来越好的对话响应，但它们同时也需要大量的

......

本文由站长之家合作伙伴自媒体作者“机器之心公众号”授权发布于站长之家平台，本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间，为了保证文章信息的及时性，内容观点的准确性，平台将不提供完全的内容展现，本页面内容仅为平台搜索索引使用。需阅读完整内容的用户，请查看原文，获取内容详情。

即将跳转到外部网站

安全性未知，是否继续

继续前往

（举报）

相关推荐

关键词：

7款AI大模型写高考作文，语文名师点评，豆包、GPT等斩获前三

刚刚， 2025 年高考作文题目出炉，再次成为亿万网友关注的话题。越来越“聪明”的人工智能大模型写高考作文真题，会带给我们怎样的惊喜?阅卷老师又会给出怎样的分数呢?今年湖北高考语文采用全国一卷，作文题为根据给定的材料进行写作。根据阅卷老师的打分，豆包、通义千问、GPT-4o的作品斩获前三名。全国一卷阅读下面的材料，根据要求写作。( 60 分)他想要给孩子们唱

高考作文人工智能阅卷评分
OpenAI奥特曼：GPT5预计今年夏季发布

OpenAI创始人奥特曼在最新播客中透露，GPT-5预计今夏发布，具体日期未定。 GPT-5将是生成式AI能力的重大升级，《商业内幕》称其远超GPT-4，早期测试者认可进步显著。 GPT-4于2023年3月发布，较上一代GPT-3.5有了显著提升。上月初，奥特曼发文向GPT-4告别。目前GPT-4o已经完全替代了GPT-4，前者于2024年5月14日发布，其中o”代表omni”，意为全能”。

GPT-5发布生成式AI升级奥特曼播客
有道14B低成本轻量模型“子曰3”开源，数学推理性能超越大模型

网易有道6月23日开源国内首个专注数学教育的"子诳3"大模型系列数学模型(Confucius3-Math)。该模型在单块消费级GPU上高效运行，在多项数学推理任务中性能超越更大规模的通用模型，高考数学题测试得分达98.5分。其训练成本仅2.6万美元，推理性能是DeepSeek+R1的15倍，服务成本低至每百万token0.15美元，大幅降低教育AI应用门槛。该开源模型为教育公平提供低成本、高性能的AI�

子曰3 开源大模型数学教育
破解高密散热难题，维谛技术（Vertiv） 360AI混合制冷方案重塑AI时代热管理

文章主要探讨AI大模型训练带来的高温危机及解决方案。随着GPU集群全功率运转，数据中心面临前所未有的散热挑战，单机柜功率密度突破10kW，传统散热手段力不从心。维谛技术(Vertiv)提出"360AI高效混合制冷方案"，整合风冷、液冷和自然冷却三种方式，构建全链路温控体系。方案覆盖从服务器到户外的不同场景需求，包括风液混合型、液液CP组合等多元方案，能精准应对10-130kW不同功率密度需求。同时，维谛推出业界首创风液氟泵一体机，支持快速部署，并创新研发适配AI的自然冷高温冷机，单框架制冷能力近3MW。该方案兼顾算力需求与节能政策要求，为智算时代构建更可靠的温控底座。

高温危机 AI大模型训练混合制冷解决方案
荐AI日报：Midjourney重磅推出视频生成模型V1；OpenAI将在今年夏季发布GPT-5；谷歌推Search Live语音搜索功能

本期AI日报聚焦多项AI领域重要进展：1) Midjourney推出首款视频生成模型V1，支持21秒视频生成；2) OpenAI CEO确认GPT-5将于今夏发布；3) Google上线语音对话搜索功能Search Live；4) OpenAI开源客户服务代理框架；5) MiniMax发布智能代理Agent；6) 恶意工具WormGPT出现新变种；7) OpenAI推出企业版ChatGPT折扣；8) DeepSite V2支持3D网页动画生成；9) AI工具可秒变PPT；10) 比亚迪与字节跳动合作开发动力电池技术；11) 马斯克否认xAI巨额亏损传闻。

AI日报 Midjourney 视频生成模型
荐MiniMax深夜开源首个推理模型M1，这次是真的卷到DeepSeek了。

不知道还有多少人记得，AI行业的六小虎。行业内都在说，他们已经寂静好久了。上一次相关的项目发布，还是前一段时间我写的MiniMax声音模型的更新，Speech-02。而昨晚凌晨将近12点的时候，又是MiniMax，居然在X上，预告了他们一整周的发布计划。

AI行业 MiniMax推理模型声音模型更新
GPTBots 迎来增强版 DeepSeek-R1-0528 模型

GPTBots.ai平台宣布集成深度求索(DeepSeek)最新开源模型DeepSeek-R1-0528，该模型在推理能力上媲美OpenAI和Google的顶级模型，性能显著提升：数学竞赛准确率从70%提升至87.5%，编程性能从63.5%提升至73.3%。该模型支持JSON输出与函数调用，可无缝嵌入企业工作流，同时推出轻量级版本DeepSeek-R1-0528-Qwen3-8B，仅需16GB GPU内存即可运行。此次集成将强化GPTBots为企业提供金融、医疗、教育等领域的AI解决方案能力，助力企业构建定制化AI应用。平台秉持开源理念，采用MIT许可协议，支持商业使用与定制开发。

AI模型企业级解决方案深度学习
苹果自研AI模型难产：改用第三方大语言模型

苹果可能会跟OpenAI或Anthropic合作，双方正在谈判讨论一项潜在交易，苹果希望调用OpenAI或Anthropic的第三方大语言模型来为Siri提供技术支持。据悉，OpenAI或Anthropic正在训练适配苹果私有云计算服务器的模型，苹果也在进行测试，目前苹果发现Anthropic的AI模型最适合Siri，且与Anthropic初步讨论了一些财务条款，消息称Anthropic要求苹果每年支付数十亿美元的费用，且该费用会随时间�

苹果 Siri OpenAI
35岁抗癌网红“肉肉”去世：抗癌真的太难了

近日抗癌博主肉肉的男友发帖称，很不幸的告诉大家，肉肉于13号早晨8点永远的离开了我们，感谢大家对肉肉的关心和支持，她再也不用经受疼痛折磨了，可以躺下好好休息了，希望下辈子我们早点相遇，你只负责开心快乐就好。据了解，博主肉肉是陕西人，她在2023年确诊为乳腺癌，随后在个人账号上记录抗癌经历。去年1月她发布视频表示，抗癌真的太难了，但再难也得�

抗癌博主乳腺癌经历健康教育
荐AI日报：通义千问开源Qwen3向量模型；字节跳动图像编辑模型SeedEdit 3.0；ElevenLabs推v3语音模型

本文汇总了近期AI领域的重要动态：1)通义千问发布Qwen3-Embedding系列模型，在多语言文本处理表现优异；2)字节跳动推出图像编辑模型SeedEdit3.0，提升细节保持能力；3)ElevenLabs发布情感语音合成系统Eleven v3 Alpha；4)Anthropic推出面向国家安全的Claude Gov模型；5)可灵AI月收入连续两月超1亿元；6)Meta公布智能眼镜Aria Gen2技术细节；7)爱诗科技上线AI视频工具"拍我AI"；8)富国银行预测2030年ChatGPT广告收入将达千亿美元。

人工智能深度学习文本处理

热文

3 天
7天

三个臭皮匠顶个诸葛亮？可能是真的，已证实混合多个小模型性能比肩GPT3.5

7款AI大模型写高考作文，语文名师点评，豆包、GPT等斩获前三

OpenAI奥特曼：GPT5预计今年夏季发布

有道14B低成本轻量模型“子曰3”开源，数学推理性能超越大模型

破解高密散热难题，维谛技术（Vertiv） 360AI混合制冷方案重塑AI时代热管理

荐AI日报：Midjourney重磅推出视频生成模型V1；OpenAI将在今年夏季发布GPT-5；谷歌推Search Live语音搜索功能

荐MiniMax深夜开源首个推理模型M1，这次是真的卷到DeepSeek了。

GPTBots 迎来增强版 DeepSeek-R1-0528 模型

苹果自研AI模型难产：改用第三方大语言模型

35岁抗癌网红“肉肉”去世：抗癌真的太难了

荐AI日报：通义千问开源Qwen3向量模型；字节跳动图像编辑模型SeedEdit 3.0；ElevenLabs推v3语音模型

热文

小米汽车回应YU7是否难破窗：无需担心随车赠送破窗锤

特斯拉中国宣布Model 3/Y长续航版续航提升

小鹏G7官宣7月3日发布全球首款L3级算力车型

安克修改召回方案充电宝泡盐水处理后可获赔

董明珠说自己尽量少说话让年轻管理团队走向台前

小米YU7将开启限时改配非准现车锁单用户可参与

小米股票上热搜：盘中股价突破60港元创历史新高

小米汽车回应YU7是否难破窗：无需担心随车赠送破窗锤

特斯拉中国宣布Model 3/Y长续航版续航提升

小米YU7 3分钟大定突破200000台雷军：YU7订单要高于SU7

京东回应外卖员帮扔垃圾每单0.5元：小范围测试未正式上线

雷军说特斯拉确实了不起：引领了行业趋势尤其是FSD

小鹏G7官宣7月3日发布全球首款L3级算力车型

荣耀正式启动A股IPO 获上市辅导备案

安克修改召回方案充电宝泡盐水处理后可获赔

董明珠说自己尽量少说话让年轻管理团队走向台前

站长商机