“百模大战”家家，大模型“跑分”作弊何时休？

2023-11-29 08:50 · 稿源：罗超pro公众号

今天在朋友圈看到一张图:国内的“百模大战”已升级成“两百模大战”，据不完全统计，今年1-7月国内共发布了64个大模型，截至目前叫得出名字的国产大模型已接近200家。这么多大模型，哪些是真能打的?在每天冒出来的各类“榜单”上出现了“家家第一”的情况，甚至已不止一款国产大模

......

本文由站长之家合作伙伴自媒体作者“罗超pro公众号”授权发布于站长之家平台，本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间，为了保证文章信息的及时性，内容观点的准确性，平台将不提供完全的内容展现，本页面内容仅为平台搜索索引使用。需阅读完整内容的用户，请查看原文，获取内容详情。

即将跳转到外部网站

安全性未知，是否继续

继续前往

（举报）

相关推荐

关键词：

百度第一！百度智能云一见领跑视觉大模型赛道

IDC最新报告显示，百度智能云凭借"文心一言4.5"多模态大模型和"文心X1"深度思考模型，在视觉大模型领域综合实力排名第一。其智能云平台在算法模型、工程化落地、行业覆盖等方面优势显著，已服务餐饮、钢铁、电力等20多个行业，帮助数百家企业实现生产全环节的数字化管理。典型案例包括：为风电集团构建安全管控系统，巡检效率提升6-10倍；与中钢研合作金相分析模型，检测准确率达95%；助力连锁餐饮实现全国1000+门店服务质量量化管理，订单覆盖率从5%提升至95%。通过"云端大模型+边缘小模型"的协同架构，在保障精度的同时大幅降低应用成本，推动专业级视觉AI应用普及。

视觉大模型 IDC报告百度智能云
荐百川开源最新医疗大模型，中国力量领跑医疗AI赛道

专注医疗后，百川智能交出第一份答卷! 8月11日，百川智能发布第二款开源医疗增强推理大模型Baichuan-M2，其以32B的参数量，在OpenAI的Healthbench评测集上，超越其刚刚发布5天的开源模型gpt-oss-120b。

百川智能医疗大模型开源模型
宜人智科携“智语大模型”惊艳WAIC，展示AI赋能千行百业新成果

宜人智科作为AI驱动的数智化科技服务商，近期在世博中心展区展示多项前沿成果，全面呈现其在人工智能领域的创新实力与应用突破。公司CEO唐宁出席行业论坛，分享AI技术助力企业智能化转型的实践路径，展望AI在企业数智化进程中的新方向。宜人智科重点构建超级智能体平台，打造高效“硅基同事”，并推广“人人皆可AI”文化，通过自研工具提升工作效率。其自主研发的

人工智能数智化 AI技术
降低创作门槛！爱诗科技新一代生成式大模型加速AI视频大众化

爱诗科技8月27日发布新一代AI视频生成模型PixVerse V5，实现秒级高质量视频生成，支持360P至1080P分辨率。新模型在真实度、灵活性及生成速度上显著提升，覆盖人物、二次元、商业广告等多场景创作。同步上线Agent创作助手，降低使用门槛，用户无需专业技巧即可一键生成专业级视频。该技术推动AI视频从专业工具走向大众化应用，加速行业落地。

AI视频生成 PixVerse V5
AI大模型费用计算器：新手如何避开工具选择的三大坑

文章指出AI初学者常陷入三个陷阱：盲目选择昂贵工具、被华丽宣传迷惑、忽视隐藏成本。建议使用AIbase.cn等专业平台进行系统化评估，通过费用计算器对比主流模型成本，基于实际需求而非营销话术做决策。关键是要先对比分析再试用，找到真正契合业务需求的解决方案，避免资源浪费。
容联云「大模型金融质检」重磅升级：懂业务、全场景、高精度

金融强监管下，质检是运营关键但效率低。传统人工质检覆盖不足5%，成本高且漏检率高。容联云推出大模型质检方案，实现100%全量覆盖，准确率达96%，成本降40%。覆盖客服、营销、合同、反欺诈四大场景，将风险从被动补救转向主动预防，助力企业实现精准、高效、可溯源的智能合规管理。

金融质检合规压力人工质检
AI大模型费用计算器：新手如何不再为选择工具而头疼

文章探讨了AI工具选择困境，推荐使用AIbase.cn导航站。该站通过分类筛选、标签过滤和对比功能，帮助用户快速找到合适工具，避免信息过载。强调技术应服务于人，好的工具应降低使用门槛，而非增加困惑。
汪喵灵灵亮相亚宠论坛，AI大模型破解异宠医疗资源困局

2025年亚洲宠物展“亚洲小宠生态论坛”近日举办，汪喵灵灵创始人Luke受邀出席，分享AI宠物医疗大模型如何解决行业资源短缺、推动服务普惠化。该平台覆盖20多种宠物诊疗，通过解析海量文献建立健康档案系统，提供免费问诊与科学养护建议，降低养宠门槛。2024年已通过国家算法备案，成为业内首个合规认证的宠物健康大模型，致力于让每只宠物享有平等医疗关怀。

宠物AI医疗亚洲宠物展览会小宠生态论坛
九四智能大模型联络中心：重塑教育行业运营逻辑

文章分析了教培行业面临的获客成本高、人工客服效率低、用户画像不清晰等痛点，指出九四智能通过AI交互引擎提供全场景智能运营服务，覆盖获客、用户运营、业务通知等环节，结合语音识别、大数据分析等技术实现降本增效，并通过典型案例展示了实际应用效果。

教培行业 AI交互引擎降本增效
如何精准计算AI大模型调用成本？复杂参数太多，预算总超支怎么办？

文章探讨了AI模型调用成本管理的痛点，包括GPT-4等模型复杂的计费规则（如Token分级、上下文溢价、多模态叠加收费）导致实际成本常超预算40%。提出AIbase计算器三步解决方案：自动匹配场景参数、实时联动报价、明细成本拆解。通过跨境电商客服和高校实验室案例验证工具有效性，强调数据溯源、用量预警和预算缓冲功能，帮助开发者实现精准成本控制，告别手动制表与定�

AI模型成本 GPT-4定价 Claude3降价

今日大家都在搜的词：

热文

3 天
7天

“百模大战”家家，大模型“跑分”作弊何时休？

百度第一！百度智能云一见领跑视觉大模型赛道

荐百川开源最新医疗大模型，中国力量领跑医疗AI赛道

宜人智科携“智语大模型”惊艳WAIC，展示AI赋能千行百业新成果

降低创作门槛！爱诗科技新一代生成式大模型加速AI视频大众化

AI大模型费用计算器：新手如何避开工具选择的三大坑

容联云「大模型金融质检」重磅升级：懂业务、全场景、高精度

AI大模型费用计算器：新手如何不再为选择工具而头疼

汪喵灵灵亮相亚宠论坛，AI大模型破解异宠医疗资源困局

九四智能大模型联络中心：重塑教育行业运营逻辑

如何精准计算AI大模型调用成本？复杂参数太多，预算总超支怎么办？

今日大家都在搜的词：

热文

华为MatePad Mini官宣9月4日发布

今日七夕节微信 520 元大额红包限时上线

史上最大Mate！华为智慧屏MateTV将于9月4日发布

AI日报：海螺AI首尾帧功能上线；元石科技发布问小白5；OpenAI发

首发iPhone 17系列！苹果Apple Store官方旗舰店入驻抖音商城

华为上半年营收4270亿元同比增长3.95%：净利润371.95亿元

小米回应升级Beta后手机很烫：系统编译致短期功耗增加

迷你LABUBU开售后卖爆多平台已售罄：电商平台销量破百万

华为MatePad Mini官宣9月4日发布

2025民营企业500强揭晓：京东第一

SpaceX第10次试飞成功马斯克：星舰这次没有空中爆炸

小米澎湃OS3发布会官宣首批Beta版招募机型公布

今日七夕节微信 520 元大额红包限时上线

AI日报：字节视频模型Waver 1.0发布；百度AI搜索APP“梯子AI”

罗永浩播客节目爆火：24小时播放量超2000万晒成绩单求合作

AI日报：Wan 2.2-S2V模型即将发布；字节跳动内测3D Model Ge

AI日报：字节OmniHuman-1.5发布；PixVerse V5模型上线；腾讯

realme真我15000mAh电池容量手机亮相

站长商机